Revealing functional mechanisms of thousands of proteins in living organisms is one of the key tasks in area of protein science. At present, research methods on protein functions can be mainly categorized into three groups: experimental techniques, physics models and machine learning. Each group has its own advantages and disadvantages. In brief, the experimental techniques mean to provide reliable data, physics models such as elastic network models can provide knowledge of protein flexibility and dynamics, and machine learning methods have the advantages of low cost, high performance and ability to process large-scale data. Integrating advantages of these method helps to completely reveal the mechanisms of protein functions.. This project is planned to collect several kinds of important functional proteins or function sites, and analyze and predict their functions from sequence or structure by using mixed intelligent computation methods and by combining outputs of elastic network models. The goal of the project is to build more precise models for predictions of protein functions or function sites, to mine various function-specific characteristics in ptrotein structures and dynamics, and to construct web services for the proposed prediction and computational models. The knowledge output via this project can provide theoretical basis for the new paradigm "sequence-structure-flexibility-function" in area of protein science. It will be also helpful for several important subjects including drug design, prediction of protein structure and flexible docking.
揭示生物体内成千上万种蛋白质的功能机制是蛋白质科学研究的核心内容之一。目前,蛋白质功能研究方法主要包括实验手段、物理模型和机器学习三大类,但各具优缺点。其中,实验手段能够提供真实可靠的数据,物理模型中的弹性网络模型能够提供丰富的柔性动力学知识,而机器学习方法具有成本低、高效、数据处理规模大等特点。优势整合各类方法有助于完整揭示蛋白质的功能机制。. 本项目计划选择几种重要的功能蛋白或功能位点作为研究对象,从蛋白质的序列或结构出发,混合利用多种智能计算方法,结合弹性网络模型的输出结果,构建更加精确的功能蛋白或功能位点预测模型,挖掘各类功能显著性相关的结构性与柔性动力学新特征,并计划建立起各种预测与计算分析模型的web服务,为蛋白质的“序列-结构-柔性-功能”新范式研究提供理论基础,为药物设计、蛋白质结构预测、分子柔性对接等重大研究课题所服务。
优势整合实验方法、机器学习、物理模型等多种技术,有助于完整解释蛋白质功能机制。项目总体计划是利用混合的机器学习与特征选择优化方法,结合弹性网络模型的输出结果,构建起各种功能蛋白或功能位点的高精度预测模型,并挖掘蛋白质的结构特性与柔性动力学特性。. 本课题大部分研究计划得以顺利实施,获得的研究成果主要包括:(1)借助弹性网络模型ENM,利用多种直接提取高频正则模特征向量的方式,结合高斯朴素贝叶斯方法构建蛋白质hot spot的预测模型,优于现有的仅应用ENM识别hot spots的传统方法。(2)在Kirchhoff矩阵中设计嵌入溶剂可及性信息,保持矩阵的正定性,利用PSO方法估计新Kirchhoff矩阵中的参数,获得一种基于溶剂可及性信息优化的高斯网络模型RpfGNM。(3)计算NMR蛋白质结构的残基协涨落矩阵,利用ROPE统计学习方法分析蛋白质残基对的相互作用力常数,充分挖掘出多种未曾被发现的蛋白质结构柔性动力学特征模式,由此而新设计出的力常数极大地提升了ENM优化模型效果。. 融合ENM物理模型与机器学习方法构建蛋白质功能预测模型,可有效弥补分子动力学模拟等细粒度方法的缺陷。通过挖掘蛋白质结构与柔性动力学之间的关系特性,优化ENM,获得的研究成果有望应用于高通量的蛋白质结构预测、功能与构象变化分析任务。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
高性能并行计算环境下蛋白质相互作用网络的模式解析与功能预测
基于智能电网的复杂网络动态性能分析与优化计算
网络化多智能体系统预测控制设计与分析
岩石流变模型智能辨识及岩石工程长期稳定性智能分析与预测