With the cost decreasing of long reads sequencing, the genomic analysis of population is moving from short reads based variant calling to long reads based whole genome de novo assembly, which is expected to uncover more genomic variants. There are two unsolved problems in the analysis of whole-genome assembly, i) there is no tool available which could provide base-pair resolution, whole genome sequence alignment, ii) a lot of information hidden in the long insertions, uncovered in published pan-genome projects, has not been used for population genetic analysis. We aim to perform the whole genome-wide, base-pair resolution sequence alignment. To achieve this, we introduce a novel, efficient and accurate sequence alignment method. This project will push the population genetics and quantitative genetics study of essential species with a complex genome sequence.
三代测序技术的发展大大降低了全基因组从头拼装的成本和技术难度。群体的全基因测序正在经历从二代到三代测序技术的升级、从着眼于对测序片段到着眼于全基因组比较的分析策略转变,这一技术升级有望揭示更多的基因组多态性信息。目前针对群体从头拼装基因组数据的分析存在两个方面的难度,1:没有工具对从头拼装的全基因组序列进行全局的、单碱基分辨率的序列比对;2:泛基因组项目中发现的插入片段中隐藏着大量的遗传信息没有得到系统的挖掘和分析。本项目面向群体的全基因组从头拼装结果,采用新颖、高效的、准确的序列比对算法来解决复杂基因组的全基因组两两比对和多序列比对难题,用于群体遗传学、数量遗传学的研究。项目的研究成果将对复杂基因组物种在医药、育种、进化等领域的研究有巨大的推动作用。
随着测序技术的进步和成本的降低,越来越多的全基因重测序数据被产生出来。群体的全基因测序正在经历从二代到三代测序技术的升级、从着眼于对测序片段到着眼于全基因组比较的分析策略转变,这一技术升级有望揭示更多的基因组多态性信息。目前针对群体从头拼装基因组数据的分析存在两个方面的难度,1:没有工具对从头拼装的全基因组序列进行全局的、单碱基分辨率的序列比对;2:泛基因组项目中发现的插入片段中隐藏着大量的遗传信息没有得到系统的挖掘和分析。..本项目拼装了都匀毛尖茶树的基因组并产生了高质量的基因组注释。面向群体规模的全基因重测序和全基因组从头拼装结果,基于高质量的全基因组注释,设计新颖、高效的、准确的序列比对算法来解决复杂基因组的全基因组两两比对和多序列比对难题,用于群体遗传学、数量遗传学的研究。..在本项目的支持下,拼接并注释了都匀毛尖的基因组,开发了全基因组多序列比对工具。以本项目为第一标注在GENE发表SCI论文1 篇,申请软件著作权1项。另有合作SCI论文两篇,本项目分别为第2和第5标注...项目的研究成果将对复杂基因组物种在医药、育种、进化等领域的研究有巨大的推动作用。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
黑河上游森林生态系统植物水分来源
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
复杂基因组的三代测序技术组装算法和软件研发
泛全基因组关联分析:人类复杂疾病全基因组关联分析的整合研究
辛德毕斯病毒全基因组序列分析
全基因组复杂疾病遗传通路分析方法研究