Support vector machine (SVM), an solid optimization model, has been widely used in bioinformatic field. Here we aim to develop novel SVM models to study the drug related bioinformatics problems. It is well-known that, accurately deducing drug targets, potential indications and side effects are fundamental challenges in drug development. The basic assumption is that similar drugs usually lead to similar properties, such as interacting with similar proteins, indicating similar diseases and possessing similar side-effects. Thus the key to addressing these challenges are methods that can integrate similarity information on drugs, proteins, diseases, and side-effects from multiple data sources. In this proposal, we would like to present similarity-based methods to predict drug properties by developing new support vector machine models to incorporate various data sources. Specifically, we will collect, normalize, model, and integrate data, including drug chemical structure and therapeutic data, protein sequences and networks, side-effects and disease phenotype data. Furthermore, our new predictions will be validated by database search and literature analysis and serve as the candidates for future experimental validation. In conclusion, our new method can efficiently integrate diverse data sources, and will promote the further research in drug discovery.
支持向量机利用最优化理论和算法解决机器学习问题,在新兴的生物信息领域有着广泛的应用。本项目将基于最优化理论发展支持向量机模型进行针对药物的生物信息学研究。众所周知,准确地推断药物靶标蛋白质、用药指征以及副作用是药物研发领域面临的重要挑战。基于药物的一个基本假设是相似的药物往往会具有相近的性质,包括结合相似的蛋白质、治愈相近的疾病以及引发相近的副作用等。因此解决这些挑战的关键问题是如何整合关于药物、蛋白质、疾病和副作用的各种描述信息建立基于相似性的预测方法。本项目主要通过研究新的支持向量机模型整合药物、蛋白质、疾病和副作用的各种描述数据,包括药物结构和疗效数据、蛋白质序列及其网络数据、描述疾病以及副作用的各种数据,进而建立基于相似性的预测模型。进一步地,本项目通过文献分析和数据库搜索验证新预测的可靠性。本项目的研究不仅为数据整合提供了有效的方法,而且可以推动药物研发领域的进一步研究。
准确地推断药物靶标蛋白质、用药指征以及疗效注释系统是药物研发领域面临的重要挑战。药物靶标蛋白质是指药物分子进入活体后结合的蛋白质分子。药物在结合某个蛋白质分子后,通过改变其所在生物通路的代谢产物,发挥疗效。因此有效地识别药物靶标蛋白质即药物和蛋白质分子的结合关系不仅能帮我们理解相关的物理、遗传特性以及细胞网络的代谢连接关系, 而且可以加速新药开发的速度。准确地识别用药指征即药物可能治愈的疾病,无论对于已经获得认证的药物还是新研发的药物,都有着至关重要的作用。药物的疗效注释系统(anatomical therapeutic chemical classification system)为药物的临床使用提供了有效的依据,然而有完整注释的药物还是凤毛菱角,因此准确地推断药物的疗效注释对新药研发有着至关重要的作用。然而,尽管由于各种测序技术的发展使得模式生物蛋白质序列已知,从而加深了我们对靶标蛋白质在基因组空间中的认识,与此同时,生物实验技术的发展使得大量化合物分子的空间构象已知, 进而加深了我们对药物分子的认识, 而OMIM和SIDER数据库的建立加深我们对疾病和副作用的了解和认识,然而我们对药物和蛋白质的结合关系、药物和疾病的关系以及药物的副作用还是知之甚少。通过实验手段确定它们之间的关系又是很费时而且只限于小规模学习,因此迫切需要开发计算方法用以在全基因组水平上预测药物和蛋白质的结合关系、药物同疾病的关系以及药物的副作用。.关于药物的一个基本假设是,相似的药物往往具有相近的性质,包括结合相似的蛋白质、治愈相似的疾病以及引发相近的疗效注释等。因此解决药物研发领域三个重要问题的关键是如何整合关于药物、蛋白质、疾病的各种描述信息建立基于相似性的预测方法。本项目主要通过研究新的支持向量机模型整合药物、蛋白质、疾病的各种描述数据,包括药物结构和疗效数据、蛋白质序列及其网络数据、描述疾病的各种数据,进而建立基于相似性的预测模型。进一步地,本项目通过文献分析和数据库搜索验证新预测的可靠性。.我们的研究发现无论对于药物靶标蛋白预测、药物用药指征还是药物疗效预测问题,关于药物的各种描述数据均对预测做出贡献,更为重要的是通过核方法整合多种描述数据能够增加预测的精准度。文献和数据库检索进一步验证了模型给出的新预测的可能性,这为进一步的生物实验提供依据。
{{i.achievement_title}}
数据更新时间:2023-05-31
智能煤矿建设路线与工程实践
基于颗粒阻尼的变频空调压缩机管路减振设计
临床应用中的新型冠状病毒肺炎治疗药物研究进展
基于PROSAIL模型和多角度遥感数据的森林叶面积指数反演
区块链技术:从数据智能到知识自动化
面向蛋白质结构预测的支持向量机的研究
基于支持向量机的急性肾损伤早期诊断预测模型研究
基于支持向量机预测方法的不常用备件库存模型研究
基于支持向量机的稻田虫害预测方法研究