海量多源互补蛋白质数据的配体绑定位点预测研究

基本信息

批准号：61902352

项目类别：青年科学基金项目

资助金额：27.00

负责人：胡俊

学科分类：

依托单位：浙江工业大学

批准年份：2019

结题年份：2022

起止时间：2020-01-01 - 2022-12-31

项目状态：已结题

项目参与者：

关键词：

生物信息学多标签学习深度学习蛋白质配体绑定位点查询驱动学习

结项摘要

Accurately identifying the ligand-binding sites in protein is of significant importance for understanding protein function, analyzing the relationship between biological molecules, and instructing drug design etc. With the continuous accumulation of protein data, massive, multi-source and complementary have become the inherent characteristics of current protein data. It is highly desired to develop intelligent computational methods for predicting the ligand-binding site from protein. In this project, we will systematically carry out research on protein-ligand binding site prediction models and methods based on the thorough evaluation on the characteristics of protein data and bottlenecks of the existing prediction methods. Our major research topics include: 1) we will extract the high-quality feature from the multi-source and complementary protein data; 2) to effectively deal with the massive and ever-increasing characteristic of protein data, we will propose new query-driven prediction model by fusing data cleaning and incremental learning; 3) we will enhance the performance of ligand-specific prediction by employing multi-label learning method; 4) we will enhance the efficacy of deep learning model in the ligand-binding site prediction by introducing the known biological knowledge of proteins and the extra knowledge extracting from the unlabeled protein data; and 5) based on the theoretical research results, we will design online prediction platform for high-throughput identifying protein-ligand binding sites. We expect to research and develop effective machine learning theory and algorithms for meeting the urgent demands of protein data analysis and processing from proteomics. Also, we will provide theoretically-sound, practically-good and highly interpretable protein computational models for biologists and general users. Our research will enrich the contents of protein computation, speed up the process of unveiling the relationship between protein sequence, structure and function, and further accelerate the development of bioinformatics.

精确识别蛋白质中的配体绑定位点，对于理解蛋白质功能、分析生物分子间相互关系、指导药物设计等具有重要指导意义。随着蛋白质数据持续累积，海量、多源、互补已成为当前蛋白质数据的固有特性，研究高效可靠的计算方法来预测蛋白质配体绑定位点成为迫切需要。本项目针对蛋白质数据固有特性，在分析已有预测方法所存在的不足和瓶颈基础上，展开相关研究，以进一步提升配体绑定位点预测性能。具体内容包括：1)多源、互补蛋白质数据的特征抽取与选择；2)基于数据清理与增量式学习的查询驱动方法；3)融合多标签学习的配体特异性预测方法；4)能够充分利用蛋白质先验信息及未标注功能蛋白质数据信息的深度学习方法；5)研发高通量配体绑定位点预测平台。本研究旨在为生物学及相关研究人员提供理论依据充分、精度高、可解释性强的应用系统，进一步丰富配体绑定位点预测领域的理论和方法，亦是对计算生物领域的丰富与发展，有助于进一步推动生物信息学的发展。

项目摘要

精确识别蛋白质中的配体绑定位点，对于理解蛋白质功能、分析生物分子间相互关系、指导药物设计等具有重要指导意义。本项目针对蛋白质数据持续累积，海量、多源、互补的特性，在分析已有预测方法所存在的不足和瓶颈基础上，展开了蛋白质与配体绑定位点预测方法研究。在蛋白质特征提取研究方面提出了：1) 基于加权卷积特征的蛋白质与DNA相互作用预测方法，2）基于立方体格式特征的蛋白质与DNA相互作用位点预测方法以及3）基于深度多视角特征学习框架的蛋白质溶剂可及性预测方法；在配体特异性的模板匹配研究方面提出了：1）基于查询特异性与支持向量机的蛋白质与配体绑定位点预测方法和2）基于模板查询的ATP特异性蛋白质与配体对接方法；在深度学习算法应用方面提出了基于深度卷积神经网络的蛋白质与ATP绑定位点预测方法。本项目的研究成果可以为生物学及相关研究人员提供精度高、可解释性强的配体绑定位点预测方法，亦是对计算生物领域的丰富与发展，有助于进一步推动生物信息学的发展。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：

发表时间：2020

DOI：

发表时间：2016

DOI：10.3788/CJL201946.0801003

发表时间：2019

DOI：10.13609/j.cnki.1000-0313.2022.04.019

发表时间：2022

胡俊的其他基金

批准号：81873755

批准年份：2018

资助金额：56.00

项目类别：面上项目

批准号：11726631

批准年份：2017

资助金额：20.00

项目类别：数学天元基金项目

批准号：50905112

批准年份：2009

资助金额：20.00

项目类别：青年科学基金项目

批准号：31901662

批准年份：2019

资助金额：22.00

项目类别：青年科学基金项目

批准号：61304187

批准年份：2013

资助金额：24.00

项目类别：青年科学基金项目

批准号：11805224

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：81600419

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

批准号：60601008

批准年份：2006

资助金额：20.00

项目类别：青年科学基金项目

批准号：11372041

批准年份：2013

资助金额：80.00

项目类别：面上项目

批准号：60971032

批准年份：2009

资助金额：27.00

项目类别：面上项目

批准号：61271033

批准年份：2012

资助金额：88.00

项目类别：面上项目

批准号：51508060

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：61301019

批准年份：2013

资助金额：26.00

项目类别：青年科学基金项目

批准号：12126303

批准年份：2021

资助金额：20.00

项目类别：数学天元基金项目

批准号：41404011

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

批准号：51575352

批准年份：2015

资助金额：63.00

项目类别：面上项目

批准号：11271035

批准年份：2012

资助金额：50.00

项目类别：面上项目

批准号：41674010

批准年份：2016

资助金额：68.00

项目类别：面上项目

批准号：10971005

批准年份：2009

资助金额：23.00

项目类别：面上项目

批准号：51808496

批准年份：2018

资助金额：29.00

项目类别：青年科学基金项目

批准号：50978145

批准年份：2009

资助金额：36.00

项目类别：面上项目

批准号：10601003

批准年份：2006

资助金额：16.00

项目类别：青年科学基金项目

批准号：81200882

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

相似国自然基金

基于多源信息融合的蛋白质亚细胞定位预测算法研究

批准号：61272312

批准年份：2012

负责人：姚玉华

学科分类：F0214

资助金额：80.00

项目类别：面上项目

海量多源异构数据的使用授权与鉴权体系研究

批准号：U1836204

批准年份：2018

负责人：李瑞轩

学科分类：F0202

资助金额：252.00

项目类别：联合基金项目

海量多源异构数据的使用授权与鉴权体系研究

批准号：U1836202

批准年份：2018

负责人：陈晶

学科分类：F0202

资助金额：249.00

项目类别：联合基金项目

海量多源异构数据的使用授权与鉴权体系研究

批准号：U1836203

批准年份：2018

负责人：李凤华

学科分类：F0202

资助金额：257.00

项目类别：联合基金项目

海量多源互补蛋白质数据的配体绑定位点预测研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

基于多色集合理论的医院异常工作流处理建模

基于MCPF算法的列车组合定位应用研究

基于腔内级联变频的0.63μm波段多波长激光器

结直肠癌免疫治疗的多模态影像及分子影像评估

胡俊的其他基金

急性脑梗死超早期IVIM核磁成像的多b值优化与灌注阈值研究

基于虚拟元方法的非线性抛物型方程高精度数值方法

激光热成形的非期望变形机理与精度控制方法研究

鱿鱼墨囊共生菌对鱿鱼墨黑色素聚合度的影响

基于三维元胞自动机的候机楼疏散模型

用于硅像素探测器读出电子学的高性能实时数据处理系统方案研究

上调Wnt5a促肠隐窝重构在干预沙门氏菌致肠纤维化中的机制研究

用于复杂平台上天线特性精确分析的新型积分方程数值方法

同心筒水下环形高速气体射流的实验研究

三维电磁散射高效求解的积分方程高阶网格方法研究

用于复杂多尺度时谐电磁问题的积分方程-区域分解方法研究

山区大跨悬索桥非平稳高湍流风效应研究

基于区域分解和模型降阶混合的三维高速集成电路多尺度建模和分析方法研究

非局部微积分方程高阶数值方法研究

考虑观测值时空相关性的InSAR三维形变估计方法

碳纤维增强复合材料紫外皮秒激光铣削机理与工艺规划研究

非线性Kohn-Sham方程可靠性高精度数值方法的研究

基于动态平差理论的InSAR三维时序地表形变估计方法研究

Reissner-Mindlin板问题和变分不等式的自适应方法

供水管网输配过程中微生物胞外聚合物转化生成消毒副产物机制研究

多氯联苯类（PCBs)污染物的辐射降解研究

薄结构问题的自适应有限元方法

β-Sarcoglycan在mSOD1介导ALS骨骼肌病变中的机制研究

相似国自然基金