蛋白质相互作用中热区的发现与界定方法

基本信息
批准号:61273225
项目类别:面上项目
资助金额:80.00
负责人:张晓龙
学科分类:
依托单位:武汉科技大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:李波,陈东方,春雷,边小勇,刘俊,饶红亮,胡静,刘诚,李娟
关键词:
热点残基特征抽取热区发现蛋白质功能机器学习
结项摘要

The hot regions of protein interactions refer to the activity scope where hot spots are found to be buried and tightly packing with other residues. The discovery and discrimination of the hot regions is an important way to uncover protein functional activities, such as cell metabolism and signaling pathway, immune recognition, DNA replication, protein synthesis and biological pharmacy. In this study, machine learning method is used to discover the hot regions by using biological feature, structure feature and evolutionary feature of the proteins. With the proposed protein feature coding method, the selected training data can be effectively coded and used in classification algorithm to predict protein-protein interaction interfaces. Based on these interfaces, the hot spots are easily located and selected; the space stable conformation of the hot spots can be determined, and their binding tendency with other residues can be simultaneously calculated; and then the hot regions can be discovered and efficiently discriminated by using the proposed optimization algorithm. At last, we implement the system that integrates the above algorithms and related functions to discover and discriminate the hot regions of the protein-protein interactions. This research work gives an effective method to predict the protein-protein interfaces and the hot regions, which also provides a useful way to deeply investigate the functional activities of proteins.

蛋白质相互作用中的热区是指蛋白质与蛋白质相互作用和对接时热点残基的活动区域。热区的发现与界定是揭示诸如细胞代谢和信号传导途径、免疫确认、DNA复制、蛋白质合成和生物制药等蛋白质功能活动的一种重要手段。本研究采用机器学习算法,结合蛋白质的生物特征、结构特征和进化特征,发现并界定蛋白质相互作用界面中热区结构模块。通过设计蛋白质的特征编码方法,对选取的蛋白质数据实施蛋白质的结构特征编码,利用分类算法预测蛋白质相互作用的界面结构域;在取得界面结构域的基础上,判定和选取热点残基的集合,同时计算得到热点残基的空间稳定构象和残基结合倾向性等特征,利用提出的优化算法有效地识别出蛋白质相互作用的热区结构模块。最后,将集成阶段性的研究成果,设计并实现一个适用于蛋白质相互作用中热区发现与界定的算法系统。本研究将为解决蛋白质相互作用中界面和热区的预测问题提供新方法,同时为探明蛋白质的功能活动提供新思路。

项目摘要

项目开展了蛋白质相互作用中热区的发现与界定方法的研究。采用了机器学习聚类和分类算法,结合蛋白质的生物特征、结构特征和进化特征,判定并选取蛋白质的热点残基,识别出蛋白质相互作用的热区结构,同时对取得的热区做了验证。.在热点残基的预测之前,对数据特征做选择。采用F-score评价特征向量。利用了一个基于包装器的特征选择算法, 此外,利用序列后向选择算法进行剔除冗余特征。设计了一个基于最小二乘支持向量机(LS-SVM)和贝叶斯推理的热点残基计算方法。.设计了一个蛋白质相互作用热区的预测方法。在蛋白质-蛋白质相互作用的界面上,热点残基有聚集在一起形成热区的特性,而热点残基周围的密度,比非热点残基周围的密度要高,并且热区内部残基之间的联系也更紧密。通过空间自相关性的局部统计量,寻找邻居密度较大的残基,对这些残基进行区域划分形成初始区域,并对初始区域进行区域扩增,最终形成残基密集的热区。算法利用基于密度的增量型聚类对蛋白质数据集进行聚类,得到多个初始的聚类簇,然后利用基于蛋白质特征的SVM分类算法剔除这些聚类簇中的非热点残基,优化得到预测的热区。本项目提出的预测方法,与现有的方法相比,得到数量更多的热区,同时热区中热点的覆盖率也高于其他相关方法。.提出了一种基于序列保守性的热区验证方法。构建了热区保守性的得分函数。将BLOSUM62替换矩阵应用于构造蛋白质热区保守性得分函数,根据蛋白质模块数据库BLOCKS中蛋白质高度保守部分的比对而得到的矩阵,对目标热区中的每一个残基找到在序列中对应的氨基酸位置,分析这个氨基酸位点在其他物种中是否突变,计算突变后的氨基酸的保守性得分,根据这个蛋白质残基在不同物种中的累计保守性得分。最终达到验证热区的保守性。.通过本项目的实施,揭示了蛋白质相互作用的机理,利用机器学习算法建立了更为准确的蛋白质相互作用预测模型,取得了比现有方法更为精确的实验结果。设计了一种基于序列保守性的热区验证方法,有效地检验热区预测结果的可靠性。发表期刊论文20篇,国际会议论文14篇,培养了博士生1名,硕士生8名。本项目的研究成果为蛋白质相互作用的后期研究铺垫了基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

氟化铵对CoMoS /ZrO_2催化4-甲基酚加氢脱氧性能的影响

氟化铵对CoMoS /ZrO_2催化4-甲基酚加氢脱氧性能的影响

DOI:10.16606/j.cnki.issn0253-4320.2022.10.026
发表时间:2022
2

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究

桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究

DOI:10.5846/stxb202009292521
发表时间:2021
5

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

DOI:10.3864/j.issn.0578-1752.2019.03.004
发表时间:2019

相似国自然基金

1

基于多角度进化保守性的蛋白质热区验证方法研究

批准号:61702385
批准年份:2017
负责人:胡静
学科分类:F0213
资助金额:22.00
项目类别:青年科学基金项目
2

蛋白质与蛋白质相互作用及对接方法的研究

批准号:30400087
批准年份:2004
负责人:李春华
学科分类:C0504
资助金额:22.00
项目类别:青年科学基金项目
3

车辆跟驰行驶中驾驶安全区域的分布规律与界定方法

批准号:50878023
批准年份:2008
负责人:王武宏
学科分类:E0809
资助金额:35.00
项目类别:面上项目
4

中国社会灵活就业的界定方法与规模测定研究

批准号:70740008
批准年份:2007
负责人:杨怀印
学科分类:G03
资助金额:10.00
项目类别:专项基金项目