基于靶蛋白和短序列模体谱的植物lncRNA功能分析方法研究

基本信息
批准号:61901103
项目类别:青年科学基金项目
资助金额:24.50
负责人:滕志霞
学科分类:
依托单位:东北林业大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
基因关联网络基因调控网络网络模型构建基因组学数据多组学数据挖掘
结项摘要

Functional analysis of lncRNAs is a research hotspot and difficulty in current bioinformatics, which also plays an important role in deciphering molecular regulatory mechanisms of key traits in plants. Considering that lncRNAs perform their regulatory functions by targeting proteins through specific short sequences, our research focus on functional analysis methods of plant lncRNAs based on target proteins and short sequence motif profiles (SSMPs). Firstly, to identify targeting relationships of lncRNAs and proteins, a novel approach of predicting lncRNA-protein interaction is developed based on marginal fisher analysis and deep learning methods. Secondly, to discover the targeting relationships further from the perspectives of lncRNAs and proteins, two methods are put forward to investigate functional relationships of lncRNAs as well as proteins respectively; one detects functional relationships of lncRNAs based on SSMPs and the other measures functional similarities of proteins by fusing multiple similarities. Finally, based on the studies mentioned above, an efficient computational analysis model of plant lncRNA functions is proposed by incorporating Gene Ontology (GO) annotations of target proteins and semantic accessibility relationships of GO terms. This research will be of great theoretical significance for developing analysis methods of biological data in the intersection of information science and life science. Meanwhile, it also has potential value in molecular design of breeding for improving plant traits.

解析lncRNA的功能是当前生物信息学领域的研究热点和难点,同时这对于揭示植物关键性状的分子调控机制具有重要作用。由于lncRNA通过特异性短序列靶向作用于蛋白质行使其调控功能,本项目拟重点研究基于靶蛋白和短序列模体谱的植物lncRNA功能分析方法。首先,建立基于边际Fisher分析和深度学习的lncRNA-蛋白质相互作用预测模型,以准确识别lncRNA-蛋白质靶向关系。其次,提出基于短序列模体谱的lncRNA功能关联关系挖掘方法和基于多源相似性融合的蛋白质功能相似性度量方法,进而从lncRNA及靶蛋白层面深入挖掘lncRNA-蛋白质靶向关系。最后,以上述研究为基础,结合靶蛋白的基因本体(GO)注释以及GO语义可达关系,建立高效解析植物lncRNA功能的计算模型。本项目对研究信息科学与生命科学交叉的生物数据分析方法具有重要的理论意义,同时在植物性状改良育种的分子设计方面具有潜在的应用价值。

项目摘要

长链非编码RNA(lncRNA)是调控动植物生长发育的重要分子元件,与生物体内细胞的分化、增殖及凋亡等众多重要的生命进程密切相关。本项目以lncRNA-蛋白质之间的靶向调控关系为切入点,围绕lncRNA功能预测所涉及到的关键计算问题展开研究,取得的重要成果包括:(1)提出了一种基于边际Fisher和深度自动编码器的lncRNA-蛋白质相互作用。与同类方法相比,该方法构建的样本特征空间具有更好地表征能力和区分能力,从而能够更为精准地识别lncRNA-蛋白质之间的靶向调控关系。(2)开发了一种新的基于短序列模体谱的lncRNA功能相似性计算方法,并将其应用于乳腺癌和肺癌相关lncRNA预测。该方法突破了lncRNA功能相似性计算依赖序列之外的其他先验信息的局限性,具有优于同类方法的预测准确性,能够为识别疾病相关lncRNA提供有效的依据。(3)设计了一种基于相似性网络和靶向关系的多标签lncRNA功能预测方法,并预测HOTAIRM1和lncRNA GAS5的功能。该方法深度融合了lncRNA之间的拓扑关系特征及其自身的功能特征,进一步提升了lncRNA功能预测性能,预测结果与生物医学领域的研究结论一致性高。上述研究成果能够为生命科学领域探索lncRNA功能和调控机制提供线索指引,同时对信息科学领域发展多组学生物数据处理和分析方法具有重要的理论意义。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
4

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
5

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019

滕志霞的其他基金

相似国自然基金

1

基于网络模体与簇结构的非线性时间序列预测方法研究

批准号:61201428
批准年份:2012
负责人:孟庆芳
学科分类:F0111
资助金额:27.00
项目类别:青年科学基金项目
2

蛋白质共价修饰相关序列模体的计算发现

批准号:30900835
批准年份:2009
负责人:任间
学科分类:C0608
资助金额:20.00
项目类别:青年科学基金项目
3

基于序列谱进化信息的蛋白质远程同源性检测方法研究

批准号:61300112
批准年份:2013
负责人:刘滨
学科分类:F0213
资助金额:23.00
项目类别:青年科学基金项目
4

生物序列大数据集模体发现算法的研究

批准号:61502366
批准年份:2015
负责人:于强
学科分类:F0213
资助金额:21.00
项目类别:青年科学基金项目