Circular RNAs (circRNAs) are a class of non-coding RNAs featured with their unique structure, which have been received extensive attention. However, despite their importance, functions of the vast majority of circRNAs remain unknown, and novel mechanisms of circularization are required to explain their expression. Thus, comprehensive and unbiased reconstruction approaches of circRNAs from high-throughput transcriptomic data become an essential prerequisite of circRNA functional study. However, previous studies focused on circular junction and no methods are currently available for obtaining their full-length sequences, which largely restricts our understanding of circRNA. To address this challenge, in this project, we aim to develop a computational approach for effective reconstruction and quantification of full-length circRNAs from the transcriptome. To achieve this, we incorporate several key innovations, notably (i) a network flow algorithm to reconstruct transcripts and quantitate them simultaneously; and (ii) the capacity to filter negative reads and to perform error correction. In addition, we will employ simulated data and real transcriptomic data sets to access the performance of our algorithm. We believe this approach will be an important addition to the toolbox of circRNA identification and provide useful targets for functional screening, as well as expand our understanding of circRNAs.
作为一种新兴的内源性非编码RNA分子,环形RNA目前已成为国际上RNA领域的研究热点。目前绝大多数的环形RNA功能仍不明确,需要更多新颖的理论假说和大量的实验验证。能否从海量测序数据中高效识别和重建环形RNA转录本,成为研究环形RNA组成及功能的重要先决条件。现有的环形RNA识别方法都聚焦在对剪接位点的识别上,却无法获取其转录本全长序列,这极大限制了我们对环形RNA结构组成及内部剪接机制的认识。本申请拟在前期自主开发的环形RNA识别算法的基础上,采用图论和最大网络流算法,并结合多种数据过滤和矫正策略,建立环形RNA转录本全长组装和准确定量的计算生物学方法。同时,我们还将利用计算模拟和真实转录组测序数据对该算法进行有效性评估。本研究将填补环形RNA计算方法学的空白,并为后续环形RNA功能和进化研究提供便利的工具。
环形RNA是一类广泛存在的转录本,并且某些环形RNA不仅有着与microRNA结合的能力,还可调控基因表达和翻译短肽,这说明环形RNA具有重要的生物学功能。在以往的研究中,环形RNA的主流识别主要通过环形RNA特有的结构:反向剪切连接特征来识别。但是由于二代测序的读长普遍较短,研究者们无法高通量地获得环形RNA的完整内部结构信息。为了解决上述问题,我们提出一套全新的环形RNA识别与分析算法:CIRI-Full。这个方法首先使用了一个全新的识别环形RNA的特征:反向重叠区,用于环形RNA全长序列的识别。另外,CIRI-Full根据测序库长的分布用蒙特卡罗法模拟来自不同剪切产物的读段的在其上的测序深度分布,通过梯度下降法穷举出与实际情况最为相符的相对表达量组合来计算环形RNA内部不同可变剪接体的相对丰度。完成算法设计后,我们利用了模拟数据和实验验证了CIRI-Full算法的可行性和准确性。随后,我们利用CIRI-Full研究了物种间高度保守的环形RNA以及比较了来自20个人的肝癌组织样本与普通组织样本中环形RNA的表达,发现拥有多个剪切产物的环形RNA中,不同的环形RNA剪切产物表达量的变化不完全一致。另外,我们发现存在一类这样的环形RNA,它们在两种组织中的表达量没有显著差异,但是他们的主要剪切产物会发生变化。这些发现都表明CIRI-Full的加入可以让研究者们看到环形RNA在生物体内表达的更多细节。综上,CIRI-Full 为环形RNA的研究提供了新视角,通过更加细致内部结构展现,更加精确的定量,来辅助环研究者们筛选有潜在功能的环形RNA分子。这个工作将会对今后的环形RNA研究产生重要影响。
{{i.achievement_title}}
数据更新时间:2023-05-31
低轨卫星通信信道分配策略
基于全模式全聚焦方法的裂纹超声成像定量检测
Loss of a Centrosomal Protein,Centlein, Promotes Cell Cycle Progression
PI3K-AKT-mTOR通路对骨肉瘤细胞顺铂耐药性的影响及其机制
Complete loss of RNA editing from the plastid genome and most highly expressed mitochondrial genes of Welwitschia mirabilis
基于多网络流模型的环形RNA全长转录本组装与定量方法研究
人类心脏全长转录本注释构建及其在心肌病研究中的应用
基于RNA-seq策略研究天然反义转录本的调控机制
环形非编码RNA组学中的关键计算方法研究