Biological macromolecular interactions form the basis of many essential processes in cellular activities. Molecular modeling methods can be used to detect specific interactions of protein-protein and protein-nucleic acid complexes. These computational methods are of great value and they are complementary to experimental methods. In molecular docking studies which simulate biological macromolecular interactions, scoring functions have wide applications because they are fairly accurate, relatively robust and fast in speed. Dozens of protein-protein and protein-nucleic acid scoring functions have been developed so far, and not all of them are necessarily good. Therefore, a critical benchmark for scoring function assessment is much desired. We propose to set up such benchmarks for assessing scoring functions applicable to protein-protein, and protein-nucleic acid complexes. High quality test sets will be compiled based on the PDBbind-CN database and standard assessment processes will be designed to evaluate these two kinds of scoring functions. About 20 popular protein-protein and protein-nucleic acid scoring functions will be tested and the evaluation results will be released to the public. This work will provide reliable theoretical basis and guidance for developing scoring functions in this field.
生物大分子之间的相互作用是生命活动中许多重要进程的基础。利用分子模拟计算方法来研究蛋白-蛋白以及蛋白-核酸分子间的特异性相互作用,可以与实验方法相辅相成,因而具有重要的价值。在模拟生物大分子相互作用的分子对接研究中,打分函数由于具有精度良好、适用性强、方便快速等优点而得以广泛的应用。目前已经有许多种蛋白-蛋白和蛋白-核酸打分函数得到公开报道,其性能难免参差不齐,因此很需要建立一套客观、系统的方法体系来对这些打分函数进行评估。本课题计划为适用于蛋白-蛋白复合物以及蛋白-核酸复合物的两类打分函数分别建立评估方法体系。我们将从本课题组发展的PDBbind-CN数据库中筛选出高质量的样本构成测试集,并设计一套针对这两类打分函数的评价标准和流程。我们将采用该方法体系对目前流行的约20种蛋白-蛋白和蛋白-核酸打分函数进行评估并公开发布结果。本课题的成果将为该领域中发展更加先进的打分函数提供依据和指导。
蛋白质-蛋白质相互作用是生命活动中许多重要进程的基础。利用分子模拟方法来研究蛋白-蛋白复合物的特异性相互作用,可以与实验方法相辅相成。在模拟蛋白-蛋白相互作用的计算方法中,分子对接由于具有精度良好、适用性强、方便快速等优点而得以广泛的应用。目前,已经发展起来的蛋白-蛋白打分函数已有十数种,其性能难免参差不齐。因此,需要建立一套客观、系统的方法来对这些打分函数进行评估。在本项工作中,我们以本课题组开发和维护的PDBbind数据库作为基础,建立了标准化的复合物数据集和评估方法体系。.我们采用了三个方面的控制条件,从PDBbind数据库中筛选出高质量的蛋白-蛋白复合物构成数据集,包括结构、亲合性和多样性质量控制条件。通过上述筛选,我们得到了由273个复合物构成蛋白-蛋白复合物数据集。该数据集是目前相关领域内规模最大、数据质量最高的数据集。.我们选取四种打分函数,即ATTRACT、FASTCONTACT、dDFIRE和ZRANK,从 “对接能力”和“打分能力”两方面进行了评估。“对接能力”指打分函数从可能的分子结合构象,即诱饵集中甄别出正确的结合构象的能力。我们将晶体结构混入诱饵集中,来考察打分函数是否能正确识别出晶体结构。评估结果显示,ATTRACT和ZRANK打分函数的对接能力相当出色,其识别正确的复合物结合构象的概率约为75%,其次,dDFRE打分函数的正确率接近65%,FASTCONTACT的对接能力最差,其正确率只有约30%。.“打分能力”是指打分函数重现蛋白-蛋白复合物亲合性实验数据的能力。我们计算了蛋白-蛋白打分函数的打分值与复合物亲合性实验数据的相关性。评估结果显示,所有的四种打分函数都无法有效的预测亲合性数据,没有一种打分函数的打分结果与亲合性实验数据的Pearson相关系数超过0.2。根据上述评估结果,目前来讲蛋白-蛋白打分函数尚不能对亲合性数据进行定量预测。.综上,我们建立了高质量的蛋白-蛋白复合物数据集,并以此为基础建立了打分函数的评估体系,本课题为进一步发展研究生物大分子相互作用的理论计算方法提供了理论依据和指导。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
农超对接模式中利益分配问题研究
硬件木马:关键问题研究进展及新动向
拥堵路网交通流均衡分配模型
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
发展评价蛋白-配体相互作用打分函数的方法体系
核酸与小分子相互作用中的打分与对接研究
TB方法在有机和生物大分子体系计算研究中的应用
玉米分子标记辅助选择体系的建立与效益评价