The developmental cell lineage tree, which records every cell division events and the terminal differentiation state of each single cell, is one of the most important trait of multicellular organisms, as well as key to many significant unresolved questions in developmental biology, cancer biology, gerontology and evolutionary biology. On the one hand, recent technological breakthroughs shall increase availability of lineage tree data. On the other hand, a framework for computational analysis of the lineage tree, in particular an algorithm to compare two lineage trees, is still lacking. We and others previously found the simplicity of developmental programs in lineage trees. I.e., multiple cells invoke the same (epi-)genetic program to produce highly similar subtrees and corresponding differentiated cells. We thus hypothesize that an objective and biologically meaningful comparison between lineage trees can be built based on the search for maximal subtrees that is highly similar. Therefore, we plan to design and implement a computational algorithm for the comparison of lineage trees, and validate its biological significance in several important biological questions, such as revealing common developmental programs, and the evolutionary definition of cell types. Along with the increase of lineage tree data, our effort will establish the computational framework for comparative study of lineage trees, and provide novel insight and theoretical foundation for the myriads of important questions surrounding developmental cell lineage trees.
记录每个细胞分裂事件和细胞终末分化状态的细胞发育谱系树是多细胞生物最重要的表型之一,是解决发育、癌症、衰老、进化生物学等多个领域重大问题的关键。近年谱系树测定技术的突破发展将引领未来3~5年内谱系树数据的快速增长,然而谱系树数据生物信息分析的基础体系,特别是谱系树比对算法,尚未建立。我们在前期工作中发现谱系树上不同细胞使用的遗传程序具有精简性,即部分细胞启用相同的遗传程序,生成相同的子树及其对应的终末分化细胞。我们由此提出假设:以寻找谱系树的最大相同/相似子树为基础,可以对谱系树进行客观有意义的比较。本研究拟据此设计谱系树比对算法及相关工具,并收集公共数据验证该算法在揭示发育过程中的遗传程序,客观评价细胞分化类型的进化关系等生命科学重大问题上的应用价值,旨在在谱系树数据增长的历史机遇下,建立起与之匹配的生物信息比对算法,在细胞层次为围绕谱系树的众多重大生物学问题提供新的研究思路以理论基础。
细胞发育谱系树记录每次细胞分裂事件和每个细胞的终末分化状态,是多细胞生物最重要的表型之一,也是解决发育、癌症、衰老、进化生物学等多个领域重大问题的关键。近年基于基因编辑的谱系树测定技术的发展积累了大量的谱系树数据。针对该现状,我们提出应当建立谱系树数据生物信息分析的基础算法体系。我们在前期工作中发现谱系树上不同细胞使用的遗传程序具有精简性,即部分细胞启用相同的遗传程序,生成相同的子树及其对应的终末分化细胞。我们由此提出假设:以寻找谱系树的最大相同/相似子树为基础,可以对谱系树进行客观有意义的比较。在此基础上,我们首先设计并实现了谱系树比对算法DELTA,并在秀丽隐杆线虫的完整发育谱系树上进行了算法验证,确定了DELTA算法可以用于①量化谱系树之间的相似性,②鉴定相同/相似发育程序产生的相同/相似子树,③推断细胞类型之间的进化关系。其次,针对新技术产生的谱系树数据普遍具有多分枝现象的特点,我们针对性地开发了mDELTA算法。我们将mDELTA算法应用到本实验室测定的人类胚胎干细胞定向分化谱系树数据上,成功揭示了谱系树上存在若干结构类似的谱系树,并开发了相应的分析流程和可视化工具。最后,为了进一步推广细胞谱系树分析方法,我们构建了规范统一的谱系树数据库VIACOT,为不同谱系追踪方法构建的不同物种、不同组织或体外分化过程的谱系树之间的比较和分析提供在线的,可视化的解决方案。以上研究成果在当下谱系树数据增长的关键时间,建立了与之匹配的生物信息比对算法,在细胞层次为围绕谱系树的众多重大生物学问题提供了新的研究思路与分析方法。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于FTA-BN模型的页岩气井口装置失效概率分析
视网膜母细胞瘤的治疗研究进展
PI3K-AKT-mTOR通路对骨肉瘤细胞顺铂耐药性的影响及其机制
当归补血汤促进异体移植的肌卫星细胞存活
TGF-β1-Smad2/3信号转导通路在百草枯中毒致肺纤维化中的作用
应用单细胞技术建立人类胚胎视网膜祖细胞发育谱系
序列比对( Alignment)的随机分析与快速算法
细胞谱系随机演化的并行算法研究
珍稀濒危植物伯乐树系统进化与谱系地理学研究