As the development of sequence technology, more and more long noncoding RNAs(lncRNAs) were identified in human and mouse. These lncRNAs were involved in numbers of biological processes through regulating protein coding genes. However, the functions of most lncRNAs were still unknown.Therefore, functional annotation of lncRNAs was one of the most important projects for bioinformaticians nowadays. In this project, we proposed two functional annotation methods based on the characters of lncRNAs function in epigenetic processes: First we would explore the patterns of DNA methylation and histone modification for lncRNAs under a variety of biological processes by using of epigenetic dataset in GEO database. Second, based on the known lncRNA-target relationships and their epigenetic features, we would predict lncRNA targets through methods of intersection and Bayesian networks, and then annotate the functions of lncRNAs through constructing a epigenetic regulation network. We hoped to find out the possible biological processes of each lncRNA involved, and then would verify the functions of several lncRNAs experimentally. Our results would shed light on the further research of lncRNA roles in lots of biological processes.
随着测序技术的发展,越来越多的长非编码RNAs(lncRNAs)在人和鼠中被发现。这些lncRNAs主要对蛋白编码基因起调节作用,参与众多重要的生物过程,然而大部分lncRNAs的功能却未知,因此,挖掘lncRNAs的功能仍然是目前生物信息学家面临的重大课题。本项目中,申请者根据lncRNAs在表观遗传上的作用特点,提出两种功能注释方法:一是利用GEO数据库中的表观遗传修饰数据,挖掘lncRNAs在各种生物过程下的DNA甲基化状态和组蛋白修饰情况;二是基于已有的lncRNA-靶基因关系和各种表观遗传修饰特征,分别采用交集法和贝叶斯网络统计模型预测lncRNAs调节的靶基因,构建表观遗传调节网络从而对lncRNAs的功能进行注释。申请者希望通过以上两种方法,获得lncRNAs可能参与的生物过程,并对部分lncRNAs的功能进行实验验证,为进一步深入了解lncRNAs的作用机制提供研究线索。
长非编码RNAs是一类长度超过200nt的功能性RNA分子。近年来随着测序技术的发展,越来越多的lncRNAs在哺乳动物中被发现,而大部分lncRNAs的功能却未知,因此,对lncRNAs的功能注释已经成为当前生物信息学家的一个研究热点。目前对lncRNAs的功能注释主要基于lncRNAs与蛋白编码基因的表达关系,但lncRNAs的表达量较低,并不是每个lncRNA都可以被预测到功能,因此,本项目基于lncRNAs和蛋白编码基因的表观遗传修饰特征,提出另一种对lncRNAs功能注释的方法。首先,以大肠癌为例,分析和比较lncRNAs及蛋白编码基因的表观遗传修饰特征,包括H3K4me3、H3K27me3及DNA甲基化修饰,然后构建lncRNAs和蛋白编码基因的共甲基化网络,对部分lncRNAs进行了功能预测,有些预测的功能已经在文献中有所报道,比如HOTAIR被预测为细胞分化和代谢过程有关,而PVT1被预测为与细胞周期有关,与之前的文献报道相吻合。其次,基于lncRNAs和蛋白编码基因的全局表观遗传修饰图谱,我们构建了SVM统计模型,对基因数目大于200的GO生物过程功能进行预测,得平均AUC值为0.64。最后,我们选择LINC00473进行功能实验验证,LINC00473在共甲基化网络的功能注释中被预测为与细胞增殖相关,经过实验验证,我们发现与预测的一致,LINC00473确实具有细胞增殖的功能。我们的结果将有利于进一步进行lncRNAs的鉴定及功能注释,为lncRNAs的功能研究提供有力的线索和依据。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
低轨卫星通信信道分配策略
城市轨道交通车站火灾情况下客流疏散能力评价
基于FTA-BN模型的页岩气井口装置失效概率分析
桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究
长链非编码RNAs在蓖麻胚乳发育过程中的表达网络及其表观调控研究
毛白杨长链非编码RNAs响应镉胁迫的遗传调控机制
肝癌发生模型相关的长非编码RNA鉴定、特性分析及功能注释
长链非编码RNAs调节羊绒周期性生长的分子机制