Transcript isoform, caused by gene alternative splicing, is a common phenomenon and plays an important role in the gene expression and regulation of biological process. Currently, RNA-seq based on next-generation sequencing is the main technology for isoform research. However, identification of isoform from RNA-seq data is still challenging because of the short reads assembly of full-length transcript. Iso-seq, the third-generation sequencing technology, has a significant advantage over RNA-seq for full-length isoform identification with the long reads capability. At present, the main application of Iso-seq is focused on discovering novel isoform, gene alternative splicing and gene fusion. Nevertheless, the transcriptome-wide isoform expression and its abundance, and the sequence feature analysis by incorporating multi-omics information remains to be further studied. Therefore, this project intend to propose a method for identifying specific isoform based on the full-length transcripts from Iso-seq data, and analyze the isoform sequence feature by incorporating translatomics information. This new method will provide a novel strategy for in-depth analysis of gene transcription and translation in biological research.
转录本Isoform是由基因可变剪切引起的一种常见现象,在基因的表达和调控中发挥着重要作用。基于二代测序的RNA-seq是目前研究转录本Isoform的最主要方法,然而利用RNA-seq的短序列组装完全解析转录本Isoform仍面临一定的困难。相对于RNA-seq技术,基于三代测序的Iso-seq技术具有读长序列长,全长转录本无需组装的明显优势。目前Iso-seq主要用于研究新Isoform、可变剪切和基因融合等问题,而利用Iso-seq从全转录组水平探索特异性Isoform的表达类型和丰度,以及结合多组学解析Isoform的序列特征鲜有报道。因此,本研究提出建立基于三代测序全长转录本的特异性Isoform识别方法,并结合翻译组信息分析Isoform的序列特征,为生物学研究中深入解析基因的转录和翻译调控提供新的方法和研究策略。
转录本Isoform是由基因可变剪切引起的常见现象,在基因的表达和调控中发挥重要作用。基于二代测序的RNA-seq是目前研究转录本Isoform的最主要方法,然而利用RNA-seq的短序列组装完全解析转录本Isoform仍面临一定的困难。相对于RNA-seq技术,基于三代测序的Iso-seq技术具有读长序列长,全长转录本无需组装的明显优势。目前Iso-seq主要用于研究新Isoform、可变剪切和基因融合等问题,而利用Iso-seq从全转录组水平探索特异性Isoform的序列特征及相应的生物学含义少有报道。本项目基于三代测序的Iso-seq技术读长序列长和全长转录本无需组装的优势,建立了三代测序全长转录本的特异性Isoform识别方法,主要内容包括:1.收集三代测序全长转录组数据,建立了国际上首个全长转录组数据库ISOdb;2.利用Isoform的归并信息,整合了翻译组的翻译本和丰度信息;3.利用深度学习建立了可识别不同剪切类型的(内含子保留,外显子跳跃,3’端选择性剪切和5’端选择性剪切)的特异性Isoform的识别方法;4. 利用特异性识别Isoform的特征基序进行生物学解析。本项目的开展为Isoform水平深入解析基因的调控提供一种新研究策略和方法,为理解复杂的致病或抗性等生物学问题带来了一定的帮助。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于直观图的三支概念获取及属性特征分析
岩石/结构面劣化导致巴东组软硬互层岩体强度劣化的作用机制
城市生活垃圾热值的特征变量选择方法及预测建模
泛"胡焕庸线"过渡带的地学认知与国土空间开发利用保护策略建构
基于小波高阶统计量的数字图像来源取证方法
甘蔗双侧芽创新种质的遗传特征和相关基因的转录组测序分析
基于三代测序校正序列的基因组结构变异检测方法研究
基于单细胞转录组测序的结肠癌肝转移的免疫特征研究
骨肿瘤转移抑制基因全长cDNA克隆、测序及功能分析