Since 2013 circular RNA has become a hot spot in noncoding RNA field. Unlike other widely studied linear noncoding RNAs, circRNAs are a novel class of abundant, stable and ubiquitous RNA molecules in animals, in which the 3' and 5' ends normally present in an RNA molecule have been joined together. Although a small subset of circRNAs were revealed to function as microRNA sponges, the function of the majority of circRNAs still remains unknown. To further explore the diversity and function of circRNAs, an all-around computational tool is urgently required to dig out these cryptic molecules from high throughput but fragmented transcriptome data. In this study, we aim to develop new methods for computational.identification of circRNAs and intronic/intergenic specific fragments from transcriptomic data. In addition, we will develop new algorithms to assemble circular transcripts, to recognize novel alternative splicing circRNAs and also to quantify their expressions in transcriptomic data. Based on currently available ENCODE and FANTOM data, we will build the co-regulatory network of circRNAs and other RNA molecules and functional elements. In addition, we will develop an integrated platform for circRNA identification, assembly and functional annotation. Because of extensive attention and limited knowledge on circRNAs, we believe the tools developed in this study will be of great interest to researchers in the noncoding RNA community.
近年来,环形RNA(circRNA)成为非编码RNA领域的一个新热点。circRNA是由线性RNA两端通过3’,5’-磷酸二酯键共价相连而成的。最新研究表明它们是一类高丰度、稳定且普遍存在的分子,其个别种类可通过结合microRNA,实现对基因表达的调控作用,但绝大多数circRNA的功能并不明确。如何从海量转录组测序数据中广泛、准确地识别circRNA及其不同剪接产物,是进行后续功能和调控机制研究的关键环节。本申请拟针对上述科学问题,建立基于转录组测序数据的circRNA特有片段识别方法,开发全长拼接和转录本预测及定量方法。结合现有的ENCODE等功能组学数据,构建circRNA与其他功能元件的共调控网络,实现对circRNA表达调控机制的精确解析。同时,我们将建立相应的circRNA整合分析平台,以对非编码RNA组学数据进行高效、准确的挖掘。
近年来, 环形RNA成为国际上非编码RNA研究领域的一个新热点。由于受计算方法及研究手段的限制,目前只发现少部分环形RNA且绝大多数功能未知。对环形RNA功能的探知,仍依赖于更多的组学数据及大量的实验验证。在此过程中,能否从海量的测序数据中高效识别环形RNA及其不同形式的转录本,成为后续功能验证及表达调控机制研究的重要前提。针对目前缺乏系统的环形RNA数据挖掘的关键技术,在此项目的支持下,我们建立了环形RNA识别、转录本组装、可变剪接检测、定量和功能注释等方法。(1)首次提出基于多重种子匹配策略的算法,并建立最大似然估计模型,排除来自线性转录本或剪接副产物的干扰,极大提高了环形RNA分子识别的精度(Briefings in Bioinformatics, 2018)。(2)首次提出全新的环形转录本重构与定量的方法,通过环形转录本测序中的反向重叠区特征获得全长序列,既有效解决了环形转录本内部结构的重构难题,也为环形转录本中不同剪切产物的定量提供了新思路(Genome Medicine, 2019)。(3)从人、猴和小鼠三个物种的44个正常组织中鉴定出大量环形RNA,其中超过70%的环形转录本实现了全长重建。利用这些数据,对环形RNA的多样性、保守性、剪接模式以及与线性RNA的成环比差异进行了多方位深入分析,并建立了功能环形RNA的筛选方法。首次筛选出一类在多个物种中高度保守的环形RNA。分析表明,此类OO-型环形RNA比其他类型的环形RNA拥有更高的表达量、更趋同的表达模式、更高的成环比、更保守的剪接模式和功能富集。这些特征提示OO-型环形RNA可能拥有更加重要的生物学功能,可以用于后续的功能筛选和验证(Cell Reports,2019)。(4)通过重构具有反向剪接特征的环形RNA参考序列,简化复杂的反向剪接位点比对问题,解决了目前环形RNA识别和定量方法中准确度低和假阳性率高的问题(Nature Communications, 2020)。(5)建立了环形RNA的可视化工具---CIRI-vis,可批量展示环形RNA上的读段信息与内部结构(Bioinformatics, 2020)。这些研究丰富了我们对环形RNA的形成机制及功能的认识,为深入解析这一崭新类型的非编码RNA分子提供了重要工具。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于SSVEP 直接脑控机器人方向和速度研究
低轨卫星通信信道分配策略
Loss of a Centrosomal Protein,Centlein, Promotes Cell Cycle Progression
Complete loss of RNA editing from the plastid genome and most highly expressed mitochondrial genes of Welwitschia mirabilis
Wnt 信号通路在非小细胞肺癌中的研究进展
整合多维组学数据识别多种癌症的驱动长非编码RNA
环形非编码RNA circRNA_000203促进衰老性心肌重构的机制研究
环形RNA计算系统生物学研究
新发现的登革病毒亚基因组非编码RNA的生物学功能研究