海量多源互补蛋白质数据的配体绑定位点预测研究

基本信息
批准号:61902352
项目类别:青年科学基金项目
资助金额:27.00
负责人:胡俊
学科分类:
依托单位:浙江工业大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
生物信息学多标签学习深度学习蛋白质配体绑定位点查询驱动学习
结项摘要

Accurately identifying the ligand-binding sites in protein is of significant importance for understanding protein function, analyzing the relationship between biological molecules, and instructing drug design etc. With the continuous accumulation of protein data, massive, multi-source and complementary have become the inherent characteristics of current protein data. It is highly desired to develop intelligent computational methods for predicting the ligand-binding site from protein. In this project, we will systematically carry out research on protein-ligand binding site prediction models and methods based on the thorough evaluation on the characteristics of protein data and bottlenecks of the existing prediction methods. Our major research topics include: 1) we will extract the high-quality feature from the multi-source and complementary protein data; 2) to effectively deal with the massive and ever-increasing characteristic of protein data, we will propose new query-driven prediction model by fusing data cleaning and incremental learning; 3) we will enhance the performance of ligand-specific prediction by employing multi-label learning method; 4) we will enhance the efficacy of deep learning model in the ligand-binding site prediction by introducing the known biological knowledge of proteins and the extra knowledge extracting from the unlabeled protein data; and 5) based on the theoretical research results, we will design online prediction platform for high-throughput identifying protein-ligand binding sites. We expect to research and develop effective machine learning theory and algorithms for meeting the urgent demands of protein data analysis and processing from proteomics. Also, we will provide theoretically-sound, practically-good and highly interpretable protein computational models for biologists and general users. Our research will enrich the contents of protein computation, speed up the process of unveiling the relationship between protein sequence, structure and function, and further accelerate the development of bioinformatics.

精确识别蛋白质中的配体绑定位点,对于理解蛋白质功能、分析生物分子间相互关系、指导药物设计等具有重要指导意义。随着蛋白质数据持续累积,海量、多源、互补已成为当前蛋白质数据的固有特性,研究高效可靠的计算方法来预测蛋白质配体绑定位点成为迫切需要。本项目针对蛋白质数据固有特性,在分析已有预测方法所存在的不足和瓶颈基础上,展开相关研究,以进一步提升配体绑定位点预测性能。具体内容包括:1)多源、互补蛋白质数据的特征抽取与选择;2)基于数据清理与增量式学习的查询驱动方法;3)融合多标签学习的配体特异性预测方法;4)能够充分利用蛋白质先验信息及未标注功能蛋白质数据信息的深度学习方法;5)研发高通量配体绑定位点预测平台。本研究旨在为生物学及相关研究人员提供理论依据充分、精度高、可解释性强的应用系统,进一步丰富配体绑定位点预测领域的理论和方法,亦是对计算生物领域的丰富与发展,有助于进一步推动生物信息学的发展。

项目摘要

精确识别蛋白质中的配体绑定位点,对于理解蛋白质功能、分析生物分子间相互关系、指导药物设计等具有重要指导意义。本项目针对蛋白质数据持续累积,海量、多源、互补的特性,在分析已有预测方法所存在的不足和瓶颈基础上,展开了蛋白质与配体绑定位点预测方法研究。在蛋白质特征提取研究方面提出了:1) 基于加权卷积特征的蛋白质与DNA相互作用预测方法,2)基于立方体格式特征的蛋白质与DNA相互作用位点预测方法以及3)基于深度多视角特征学习框架的蛋白质溶剂可及性预测方法;在配体特异性的模板匹配研究方面提出了:1)基于查询特异性与支持向量机的蛋白质与配体绑定位点预测方法和2)基于模板查询的ATP特异性蛋白质与配体对接方法;在深度学习算法应用方面提出了基于深度卷积神经网络的蛋白质与ATP绑定位点预测方法。本项目的研究成果可以为生物学及相关研究人员提供精度高、可解释性强的配体绑定位点预测方法,亦是对计算生物领域的丰富与发展,有助于进一步推动生物信息学的发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于铁路客流分配的旅客列车开行方案调整方法

基于铁路客流分配的旅客列车开行方案调整方法

DOI:
发表时间:2021
2

基于多色集合理论的医院异常工作流处理建模

基于多色集合理论的医院异常工作流处理建模

DOI:
发表时间:2020
3

基于MCPF算法的列车组合定位应用研究

基于MCPF算法的列车组合定位应用研究

DOI:
发表时间:2016
4

基于腔内级联变频的0.63μm波段多波长激光器

基于腔内级联变频的0.63μm波段多波长激光器

DOI:10.3788/CJL201946.0801003
发表时间:2019
5

结直肠癌免疫治疗的多模态影像及分子影像评估

结直肠癌免疫治疗的多模态影像及分子影像评估

DOI:10.13609/j.cnki.1000-0313.2022.04.019
发表时间:2022

胡俊的其他基金

批准号:81873755
批准年份:2018
资助金额:56.00
项目类别:面上项目
批准号:11726631
批准年份:2017
资助金额:20.00
项目类别:数学天元基金项目
批准号:50905112
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:31901662
批准年份:2019
资助金额:22.00
项目类别:青年科学基金项目
批准号:61304187
批准年份:2013
资助金额:24.00
项目类别:青年科学基金项目
批准号:11805224
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:81600419
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目
批准号:60601008
批准年份:2006
资助金额:20.00
项目类别:青年科学基金项目
批准号:11372041
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:60971032
批准年份:2009
资助金额:27.00
项目类别:面上项目
批准号:61271033
批准年份:2012
资助金额:88.00
项目类别:面上项目
批准号:51508060
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:61301019
批准年份:2013
资助金额:26.00
项目类别:青年科学基金项目
批准号:12126303
批准年份:2021
资助金额:20.00
项目类别:数学天元基金项目
批准号:41404011
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:51575352
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:11271035
批准年份:2012
资助金额:50.00
项目类别:面上项目
批准号:41674010
批准年份:2016
资助金额:68.00
项目类别:面上项目
批准号:10971005
批准年份:2009
资助金额:23.00
项目类别:面上项目
批准号:51808496
批准年份:2018
资助金额:29.00
项目类别:青年科学基金项目
批准号:50978145
批准年份:2009
资助金额:36.00
项目类别:面上项目
批准号:10601003
批准年份:2006
资助金额:16.00
项目类别:青年科学基金项目
批准号:81200882
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

基于多源信息融合的蛋白质亚细胞定位预测算法研究

批准号:61272312
批准年份:2012
负责人:姚玉华
学科分类:F0214
资助金额:80.00
项目类别:面上项目
2

海量多源异构数据的使用授权与鉴权体系研究

批准号:U1836204
批准年份:2018
负责人:李瑞轩
学科分类:F0202
资助金额:252.00
项目类别:联合基金项目
3

海量多源异构数据的使用授权与鉴权体系研究

批准号:U1836202
批准年份:2018
负责人:陈晶
学科分类:F0202
资助金额:249.00
项目类别:联合基金项目
4

海量多源异构数据的使用授权与鉴权体系研究

批准号:U1836203
批准年份:2018
负责人:李凤华
学科分类:F0202
资助金额:257.00
项目类别:联合基金项目