基于多标记学习的蛋白质亚细胞多位置预测方法研究

基本信息

批准号：61402422

项目类别：青年科学基金项目

资助金额：25.00

负责人：王晓

学科分类：

依托单位：郑州轻工业大学

批准年份：2014

结题年份：2017

起止时间：2015-01-01 - 2017-12-31

项目状态：已结题

项目参与者：朱颢东,张伟伟,王榕,黄新彭,许允倩,孙振

关键词：

半监督学习多标记学习集成学习蛋白质亚细胞定位预测多位置蛋白质

结项摘要

Protein subcellular multi-locations prediction is an emerging and important research direction in bioinformatics. Traditional machine learning methods are difficult to deal with proteins with multiple subcellular locations. This research subject will deeply analyze the characteristics of the multi-location protein data and study new protein subcellular multi-locations prediction methods for improving the performance of prediction by using multi-label learning approaches. Firstly, a new denoising method is proposed, which could revise the noise of relevant features and thus reduce the influence of noise on modeling effect. Secondly, an optimal multi-label ensemble algorithm is proposed, which could fuse the multi-source features of protein data and thus improve protein subcellular multi-locations prediction performance. Thirdly, in combination with semi-supervised learning, an inductive semi-supervised multi-label algorithm is proposed, which could utilize a large amount of proteins without subcellular localization annotation to aid training and thus improve prediction performance in the case of insufficient labeled proteins. Finally, the online service platform of protein subcellular multi-locations prediction will be built for researchers based on the above research results. This research subject will greatly improve the effect of protein subcellular multi-locations prediction, and provide new ideas, methods and platforms for the field.

蛋白质亚细胞多位置预测是生物信息学中的新兴重要研究方向。传统的两类或多类机器学习方法很难适应蛋白质同时拥有多个亚细胞位置的新情况。本课题拟从多位置蛋白质数据的特点入手，以提高预测性能为目标，以多标记学习为主要技术手段，研究新的亚细胞多位置预测方法。首先，提出蛋白质数据的关键特征去噪方法，减少噪声对建模效果的影响；其次，引入集成学习技术，提出融合多源特征的最优多标记集成算法，提高多源蛋白质数据的亚细胞多位置预测性能；再次，结合半监督学习，提出利用无位置标注蛋白质的归纳式半监督多标记算法，提高少量标注情况下的亚细胞多位置预测性能；最后，基于上述研究成果，构建在线蛋白质亚细胞多位置预测服务平台，为领域研究人员服务。本课题研究将极大地提升蛋白质亚细胞多位置预测的效果，同时为该领域的研究提供新的思路、方法和平台。

项目摘要

本项目针对蛋白质亚细胞多位置计算预测中的若干关键科学问题展开深入研究，获得主要研究成果如下：1）构建两个全新的蛋白质亚细胞多位置预测数据集，多位置蛋白质亚叶绿体数据集和多位置细胞凋亡蛋白质数据集；2）提出结合标记相关特征和标记间关系的亚细胞多位置预测方法，提出基于集成学习和GO本体特征的多标记集成预测方法，提出利用亚细胞位置相关特征的凋亡蛋白质多位置预测方法；3）针对缺失数据补全问题，提出基于全局和局部信息的递归互补全算法，针对优化计算问题，提出基于组合重组和改进超变异算子的克隆选择算法。成果已开发为生物信息在线预测服务平台，为生物学家提供服务和帮助，推动该领域研究的发展。项目组在Bioinformatics、BMC Genomics 、BMC Bioinformatics 、BioMed Research International等国内外权威刊物上发表论文11篇，其中SCI 收录8 篇，获得国家发明专利1 项。研究团队获得河南省科技进步二等奖。上述研究成果，对蛋白质亚细胞定位预测的发展和应用提供了基本理论和技术基础。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：

发表时间：2020

DOI：

发表时间：2020

DOI：

发表时间：2016

DOI：10.11654/jaes.2022-0087

发表时间：2022

王晓的其他基金

批准号：31900687

批准年份：2019

资助金额：24.00

项目类别：青年科学基金项目

批准号：10826058

批准年份：2008

资助金额：3.00

项目类别：数学天元基金项目

批准号：10805072

批准年份：2008

资助金额：20.00

项目类别：青年科学基金项目

批准号：41806117

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：51803017

批准年份：2018

资助金额：24.00

项目类别：青年科学基金项目

批准号：50073030

批准年份：2000

资助金额：19.00

项目类别：面上项目

批准号：11901159

批准年份：2019

资助金额：22.00

项目类别：青年科学基金项目

批准号：11871453

批准年份：2018

资助金额：52.00

项目类别：面上项目

批准号：81602625

批准年份：2016

资助金额：18.00

项目类别：青年科学基金项目

批准号：41876199

批准年份：2018

资助金额：62.00

项目类别：面上项目

批准号：81870526

批准年份：2018

资助金额：57.00

项目类别：面上项目

批准号：41907303

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：11401577

批准年份：2014

资助金额：22.00

项目类别：青年科学基金项目

批准号：81570693

批准年份：2015

资助金额：58.00

项目类别：面上项目

批准号：30700382

批准年份：2007

资助金额：17.00

项目类别：青年科学基金项目

批准号：81870322

批准年份：2018

资助金额：57.00

项目类别：面上项目

批准号：81500918

批准年份：2015

资助金额：17.50

项目类别：青年科学基金项目

批准号：61702519

批准年份：2017

资助金额：21.00

项目类别：青年科学基金项目

批准号：20872083

批准年份：2008

资助金额：30.00

项目类别：面上项目

批准号：21872068

批准年份：2018

资助金额：66.00

项目类别：面上项目

批准号：81600209

批准年份：2016

资助金额：17.50

项目类别：青年科学基金项目

批准号：81170720

批准年份：2011

资助金额：51.00

项目类别：面上项目

批准号：81000733

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：31040063

批准年份：2010

资助金额：10.00

项目类别：专项基金项目

批准号：11701338

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：81370876

批准年份：2013

资助金额：61.00

项目类别：面上项目

批准号：81070617

批准年份：2010

资助金额：30.00

项目类别：面上项目

批准号：11301505

批准年份：2013

资助金额：22.00

项目类别：青年科学基金项目

批准号：81701605

批准年份：2017

资助金额：20.00

项目类别：青年科学基金项目

批准号：81473298

批准年份：2014

资助金额：68.00

项目类别：面上项目

相似国自然基金

面向蛋白质功能预测的多标记学习方法研究与应用

批准号：61402378

批准年份：2014

负责人：余国先

学科分类：F0213

资助金额：26.00

项目类别：青年科学基金项目

基于深度迁移学习的微拟球藻蛋白质亚细胞定位预测方法研究

批准号：31900071

批准年份：2019

负责人：公衍海

学科分类：C0105

资助金额：24.00

项目类别：青年科学基金项目

基于多源信息融合的蛋白质亚细胞定位预测算法研究

批准号：61272312

批准年份：2012

负责人：姚玉华

学科分类：F0214

资助金额：80.00

项目类别：面上项目

基于特征学习和标记关联的多标记学习算法研究

批准号：61563016

批准年份：2015

负责人：余鹰

学科分类：F0603

资助金额：39.00

项目类别：地区科学基金项目

基于多标记学习的蛋白质亚细胞多位置预测方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展

基于多色集合理论的医院异常工作流处理建模

基于MCPF算法的列车组合定位应用研究

施用生物刺激剂对空心菜种植增效减排效应研究

王晓的其他基金

内向整流钾通道Kir调控视觉信号传递的机制研究

非局部时滞反应扩散生物数学模型的动力学研究

第三代同步辐射光源磁铁减振机理研究

复杂背景特征下侧扫声呐图像目标自动探测方法研究

棉织物可控接枝核苷酸/氨基酸梯度聚合物的成炭行为和阻燃机理

旋转成型聚合物复合材料的制备研究

稳定 Lévy 过程驱动系统的 Fokker-Planck 方程及应用

随机非线性优化的算法及理论研究

SNX-2112调控UPR-IRE1信号通路对食管癌细胞凋亡的作用机制

南黄海绿潮对浮游动物优势种种群补充、食物组成及群落结构的影响

β-羟基丁酰化在丁酸钠调节胰岛β细胞功能中的作用研究

光催化自由基抑制NO/二甲苯体系SOA和O3生成的机理研究及材料优化

时滞自组织系统的集群性及其在多无人机协同编队中的应用研究

Tph1在CREB调控胰岛β细胞功能中的作用研究

Visfatin保护胰岛β细胞功能的机制研究

脂肪因子CTRP9调控AMPK通路及平滑肌细胞表型转化抑制动脉钙化的机制研究

遗忘型轻度认知障碍患者内颞叶记忆网络动态变化研究

基于个体及群体影响力量化分析的动态网群组织(CMOs)演化规律及规模预测研究

基于可逆络合反应的高速逆流色谱分离体系及分离机理研究

过渡金属催化的新型烯烃温和羰基化反应

脂肪保护因子CTRP9调控自噬在阻塞性睡眠呼吸暂停致心肌损伤中的机制研究

visfatin胰岛β细胞保护作用的蛋白乙酰化机制

新型致癌因子CIP2A在HPV致宫颈癌发生发展过程中作用机制的初步研究

辣椒干制过程中红变机制及调控

区间值时序数据挖掘中聚类与预测的研究

丝氨酸合成回补代谢通路在TSA保护胰岛功能中的作用研究

蛋白乙酰化在胰岛β细胞增殖中的作用及机制研究

电子结构计算中的矩阵优化问题

多胺通过AKT/GSK3β通路抑制系统性红斑狼疮DNA甲基化的机制研究

基于“双重逆境胁迫”假说的金银花干燥过程的褐变机制研究

相似国自然基金