Mitochondria, as the center of powerhouse, metabolism and apoptosis, play host to one of the most important processes in cell of kinds of creature, which is always the research hot point of life science. It is important to know the high efficient protein import mechanism of mitochondria for the understanding life science like cancer treatment etc. Deep learning method can be used to find fundamental rules from raw data with multiple level neural networks. In this project, we focus on the import of mitochondria protein, and use deep learning model on raw protein sequence and their expression data inside mitochondria to find the correlation of the protein sequence and high expression. We will exploring the reason of high efficient of mitochondria protein import from the sequence level.
线粒体作为细胞的产能中心、代谢中心和凋亡中心,无论从系统发生、细胞代谢或蛋白质互作等各个方面,其功能结构与内在机制一直都是生命科学研究的核心问题。理解线粒体蛋白质跨膜转运机制、探索线粒体蛋白质高效导入的关键因素,无论在拓展生命科学的基础理论上,还是诸如癌症治疗等现实问题上,都具有重要而深远的意义。深度学习方法可以从原始数据中直接发现深层规律,用多层的非线性转换单元发现大数据中的复杂结构与潜在规律。本项目针对可高效导入线粒体的蛋白质为主要研究对象,利用线粒体蛋白组学数据以及蛋白质的序列、结构和理化特征等信息,采用以深度学习为主的机器学习方法,深入的理解蛋白质导入线粒体的过程,从序列层面发现保证线粒体蛋白质可高效导入的重要因素,揭示线粒体蛋白质前体与线粒体上功能部件的作用机制。
线粒体是进行呼吸作用最重要的细胞器,是细胞通过呼吸作用氧化磷酸化并合成三磷酸腺苷的主要场所。绝大多数的线粒体蛋白质,由细胞核的基因编码并在细胞质中合成为蛋白质前体,经由不同种类的移位酶导入到线粒体中,再经过剪切和折叠成最终的蛋白质,才能行使其功能。而每种蛋白质的前体中都具有特定的导入信号,线粒体及移位酶根据这些信号将特定的蛋白质送入线粒体外膜、膜间、内膜或基质特定的位置。本项目根据线粒体蛋白质的序列和基因本体知识表示,建立了线粒体蛋白质定位分类模型和亚线粒体定位分类模型。以此研究为基础,提出了面向特定蛋白质家族的蛋白质分类和识别算法等。本项目从生物序列特征分析和基于本体的知识表示两个重要方面,对生物序列的分析和分类进行了深入的相关研究,建立了线粒体等特定家族蛋白质分类和识别的方法与模型,为解决生物序列的功能分析等提供了有效工具,推进了计算机与生物医药领域相结合的交叉学科研究。
{{i.achievement_title}}
数据更新时间:2023-05-31
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
丙二醛氧化修饰对白鲢肌原纤维蛋白结构性质的影响
多源数据驱动CNN-GRU模型的公交客流量分类预测
时间序列分析与机器学习方法在预测肺结核发病趋势中的应用
线粒体自噬的调控分子在不同病生理 过程中的作用机制研究进展
基于卷积神经网络+递归神经网络的物体关键点定位方法研究
基于KKT条件的优化递归神经网络簇设计
基于深度卷积递归神经网络的多视角步态识别研究
基于递归注意力神经网络的图文摘要方法研究