海量多源互补蛋白质数据的配体绑定位点预测研究

基本信息
批准号:61902352
项目类别:青年科学基金项目
资助金额:27.00
负责人:胡俊
学科分类:
依托单位:浙江工业大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
生物信息学多标签学习深度学习蛋白质配体绑定位点查询驱动学习
结项摘要

Accurately identifying the ligand-binding sites in protein is of significant importance for understanding protein function, analyzing the relationship between biological molecules, and instructing drug design etc. With the continuous accumulation of protein data, massive, multi-source and complementary have become the inherent characteristics of current protein data. It is highly desired to develop intelligent computational methods for predicting the ligand-binding site from protein. In this project, we will systematically carry out research on protein-ligand binding site prediction models and methods based on the thorough evaluation on the characteristics of protein data and bottlenecks of the existing prediction methods. Our major research topics include: 1) we will extract the high-quality feature from the multi-source and complementary protein data; 2) to effectively deal with the massive and ever-increasing characteristic of protein data, we will propose new query-driven prediction model by fusing data cleaning and incremental learning; 3) we will enhance the performance of ligand-specific prediction by employing multi-label learning method; 4) we will enhance the efficacy of deep learning model in the ligand-binding site prediction by introducing the known biological knowledge of proteins and the extra knowledge extracting from the unlabeled protein data; and 5) based on the theoretical research results, we will design online prediction platform for high-throughput identifying protein-ligand binding sites. We expect to research and develop effective machine learning theory and algorithms for meeting the urgent demands of protein data analysis and processing from proteomics. Also, we will provide theoretically-sound, practically-good and highly interpretable protein computational models for biologists and general users. Our research will enrich the contents of protein computation, speed up the process of unveiling the relationship between protein sequence, structure and function, and further accelerate the development of bioinformatics.

精确识别蛋白质中的配体绑定位点,对于理解蛋白质功能、分析生物分子间相互关系、指导药物设计等具有重要指导意义。随着蛋白质数据持续累积,海量、多源、互补已成为当前蛋白质数据的固有特性,研究高效可靠的计算方法来预测蛋白质配体绑定位点成为迫切需要。本项目针对蛋白质数据固有特性,在分析已有预测方法所存在的不足和瓶颈基础上,展开相关研究,以进一步提升配体绑定位点预测性能。具体内容包括:1)多源、互补蛋白质数据的特征抽取与选择;2)基于数据清理与增量式学习的查询驱动方法;3)融合多标签学习的配体特异性预测方法;4)能够充分利用蛋白质先验信息及未标注功能蛋白质数据信息的深度学习方法;5)研发高通量配体绑定位点预测平台。本研究旨在为生物学及相关研究人员提供理论依据充分、精度高、可解释性强的应用系统,进一步丰富配体绑定位点预测领域的理论和方法,亦是对计算生物领域的丰富与发展,有助于进一步推动生物信息学的发展。

项目摘要

精确识别蛋白质中的配体绑定位点,对于理解蛋白质功能、分析生物分子间相互关系、指导药物设计等具有重要指导意义。本项目针对蛋白质数据持续累积,海量、多源、互补的特性,在分析已有预测方法所存在的不足和瓶颈基础上,展开了蛋白质与配体绑定位点预测方法研究。在蛋白质特征提取研究方面提出了:1) 基于加权卷积特征的蛋白质与DNA相互作用预测方法,2)基于立方体格式特征的蛋白质与DNA相互作用位点预测方法以及3)基于深度多视角特征学习框架的蛋白质溶剂可及性预测方法;在配体特异性的模板匹配研究方面提出了:1)基于查询特异性与支持向量机的蛋白质与配体绑定位点预测方法和2)基于模板查询的ATP特异性蛋白质与配体对接方法;在深度学习算法应用方面提出了基于深度卷积神经网络的蛋白质与ATP绑定位点预测方法。本项目的研究成果可以为生物学及相关研究人员提供精度高、可解释性强的配体绑定位点预测方法,亦是对计算生物领域的丰富与发展,有助于进一步推动生物信息学的发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能

DOI:10.16085/j.issn.1000-6613.2022-0221
发表时间:2022
2

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
3

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

氯盐环境下钢筋混凝土梁的黏结试验研究

氯盐环境下钢筋混凝土梁的黏结试验研究

DOI:10.3969/j.issn.1001-8360.2019.08.011
发表时间:2019

胡俊的其他基金

批准号:81873755
批准年份:2018
资助金额:56.00
项目类别:面上项目
批准号:11726631
批准年份:2017
资助金额:20.00
项目类别:数学天元基金项目
批准号:50905112
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:31901662
批准年份:2019
资助金额:22.00
项目类别:青年科学基金项目
批准号:61304187
批准年份:2013
资助金额:24.00
项目类别:青年科学基金项目
批准号:11805224
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:81600419
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目
批准号:60601008
批准年份:2006
资助金额:20.00
项目类别:青年科学基金项目
批准号:11372041
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:60971032
批准年份:2009
资助金额:27.00
项目类别:面上项目
批准号:61271033
批准年份:2012
资助金额:88.00
项目类别:面上项目
批准号:51508060
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:61301019
批准年份:2013
资助金额:26.00
项目类别:青年科学基金项目
批准号:12126303
批准年份:2021
资助金额:20.00
项目类别:数学天元基金项目
批准号:41404011
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:51575352
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:11271035
批准年份:2012
资助金额:50.00
项目类别:面上项目
批准号:41674010
批准年份:2016
资助金额:68.00
项目类别:面上项目
批准号:10971005
批准年份:2009
资助金额:23.00
项目类别:面上项目
批准号:51808496
批准年份:2018
资助金额:29.00
项目类别:青年科学基金项目
批准号:50978145
批准年份:2009
资助金额:36.00
项目类别:面上项目
批准号:10601003
批准年份:2006
资助金额:16.00
项目类别:青年科学基金项目
批准号:81200882
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

基于多源信息融合的蛋白质亚细胞定位预测算法研究

批准号:61272312
批准年份:2012
负责人:姚玉华
学科分类:F0214
资助金额:80.00
项目类别:面上项目
2

海量多源异构数据的使用授权与鉴权体系研究

批准号:U1836204
批准年份:2018
负责人:李瑞轩
学科分类:F0202
资助金额:252.00
项目类别:联合基金项目
3

海量多源异构数据的使用授权与鉴权体系研究

批准号:U1836202
批准年份:2018
负责人:陈晶
学科分类:F0202
资助金额:249.00
项目类别:联合基金项目
4

海量多源异构数据的使用授权与鉴权体系研究

批准号:U1836203
批准年份:2018
负责人:李凤华
学科分类:F0202
资助金额:257.00
项目类别:联合基金项目