LncRNAs, whose number increases abruptly from vertebrates to placental mammals and to primates, regulate the expression of many genes by interacting with polycomb proteins and mediating DNA methylation and chromatin modification. Human genome has at least 14000 lncRNAs, of which one-third may be primate-specific, indicating clade-specificity of lncRNAs and the importance of human- and primate-specific lncRNAs for the evolution, speciation, physiology, and diseases of humans. Thus critical, yet unclear, questions include what lncRNAs are primate- and human-specific, how they have evolved and have been influenced by primate-specific transposable elements, and what are their genomic targets. Upon solid preliminary works, excellent supercomputing resources, and self-developed novel software for lncRNA:DNA binding analysis, in this project we will: 1. search the homologs of 14000 human lncRNAs in 13 species to identify primate- and human-specific lncRNAs, 2. predict these lncRNAs’ DNA binding motifs and binding sites, 3. analyze these lncRNAs’ evolutionary and structural features, including their variations in different human populations, 4. analyze data of omics-sequencing of cancer cell lines, 5. decipher erroneous gene expression in cancer cells upon integrated analysis of aberrant expression of protein-coding genes and lncRNA genes and aberrant patterns of genome modification.
LncRNA通过调控基因组修饰而调控大量基因表达,其数量在真哺乳动物和灵长类显著增加。人类至少有14000个lncRNA,其中三分之一可能是灵长类特有的,提示lncRNA在人类进化、种群、生理与疾病中起重要作用。哪些lncRNA是灵长类和人类特有的、这些lncRNA如何形成和进化、如何受灵长类特异性转座子的影响、呈现哪些种群差异、介导修饰哪些基因组位点是重要而未明了的科学问题,属于计算基因组分析问题。基于大量前期工作、超级计算资源、创新的分析软件,本项目内容与目标是:1.在13个物种搜索14000个人类lncRNA的同源基因,发现人类和灵长类特异性lncRNA,2.分析这些lncRNA的DNA结合域与结合位点,3.分析这些lncRNA的进化特性与种群特性,4.根据肿瘤细胞lncRNA异常表达、基因组异常修饰、基因异常表达,结合多组学测序和lncRNA功能域分析,检验、补充、核实计算分析。
国际合作的GENCODE项目于2012年和2014年分别报道了对人类和小鼠长链非编码RNA(简称lncRNA)的系统性识别与分析,且估计多达三分之一的人类lncRNA可能是灵长类特异的,随后,GENCODE项目报道了更多的人类和小鼠lncRNA。这些结果强烈提示lncRNA基因不仅数量巨大,而且具有突出的种系特异性,这两点使得对哺乳动物lncRNA的种系特异性的起源、进化、功能进行深入研究极其必要,也正是本课题的立项背景和依据。本课题针对5个科学问题:①人类 lncRNA 呈现怎样的种系特异性(哪些 lncRNA 是灵长类和人类特有的)?②灵长类和人类特异性 lncRNA 呈现怎样的功能富集性(针对性调控某些基因和通路)?③人类特异性 lncRNA 的种群特性?④人类特异性 lncRNA 具有哪些调控基因组修饰的功能域及其对基因组修饰(特别是肿瘤中的异常基因组修饰)的影响?⑤lncRNA 从序列起源到功能形成的机制(什么进化阶段的lncRNA 序列是可能有功能的)?主要研究内容是①根据 GENCODE(v18)报道的人类13562 个lncRNA搜索 16个有袋类、真哺乳类、灵长类以及尼安德特人基因组,确定人类 lncRNA 在哪些物种有哪些缺失,由此确定灵长类和人类特异性 lncRNA,②分析灵长类和人类特异性 lncRNA是否富集地分布于某些蛋白质编码基因或通路,③使用千人基因组数据和群体遗传学方法,分析和发现人类种群间与 lncRNA 有关的单核苷酸多态性,。其次,分析适应性进化正选择位点,④分析灵长类和人类特异性 lncRNA 的 DNA 结合域和结合位点。其次,根据肿瘤组织与细胞系多组学测序数据,分析 lncRNA 表达异常与基因组甲基化异常之间的关.联,
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
人像脸谱的分析与计算机识别
A-to-I RNA编辑事件的计算识别、组织特异性和功能作用的系统分析
对哺乳动物lncRNA起源与功能种系特异性的进一步系统分析
通过集成分析小RNA和基因组高通量测序数据识别人类和灵长类疾病模型 microRNA的编辑和突变