基因组复杂变异的检测算法和应用

基本信息
批准号:31671372
项目类别:面上项目
资助金额:65.00
负责人:叶凯
学科分类:
依托单位:西安交通大学
批准年份:2016
结题年份:2020
起止时间:2017-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:孙世权,吕佳,钟韬,王晓,曹萌,张娜娜,赵凤仪,杨静
关键词:
基因组大数据特征选择软件开发机器学习
结项摘要

The curiosity on mankind and environment drives the advances of human race. Among many of miraculous achievements, the human genome project was one of them, with resources from multiple nations and using the first generation sequence technology. This has revolutionized the way modern medicine and medical health as well as basic biological research. After the establishment of human reference genome, we have entered the phase of resequencing, which is characterized as sequencing more and more individuals and building a deep catalog of human variation to understand how human race evolve, migrate as well as how variations contribute to diseases. The applicant started to investigate novel algorithms for the next generation sequence data analysis in 2008 and has contributed to 1000 Genomes Project, The Cancer Genome Atlas, The International Cancer Genome Consortium and the Genome of the Netherlands. Currently the applicant is working together with human structural variation consortium to combine the second and the third generation sequencing data for a comprehensive, precise and high quality variation set from family sequence data of 3 trios. The applicant aims to apply the novel algorithms to the public population sequence data like 1000 Genomes project, disease sequencing projects like Cancer genomes and local diseases in China. With all these above, we will gain knowledge about how species evolve and migrate as well as genotype-phenotype interaction. This will provide technical support for precision medicine.

人类对自身和周围环境的探索推动着社会的进步。其中,集中多国力量,使用第一代测序技术完成的人类基因组计划,极大促进了现代生物医药和医疗健康科技的发展。在高质量人类基因组参考序列建立后,基因组学进入到个体的重测序阶段,即以参考基因组为标准,对不同个体的外显子甚至全基因组进行高通量测序,研究个体基因组上的各种类型的基因组变异、以及变异同各种疾病之间相关性。申请人从2008年开始接触第二代测序数据,并针对该技术特点设计开发了一系列算法软件。当前,申请人在人类结构基因组计划的国际项目合作框架下同英美德的科研人员一道研究如何综合使用第二代和第三代测序技术数据和家族性数据提高对大尺度和复杂型变异的计算灵敏度、准确度和精度,设计并编写出一个完备的计算基因组复杂变异的软件包,并运用该方法到千人基因组数据、肿瘤基因组数据和其它疾病基因组数据上,发现关于物种演化和迁移以及疾病相关的新知识,为精准医疗提供方法学。

项目摘要

项目背景.第一代测序技术驱动人类基因组计划,极大促进了现代生物医药和医疗健康科技的发展。随后,基因组学进入到个体的重测序阶段,即以参考基因组为标准,对不同个体的外显子甚至全基因组进行高通量测序,研究个体基因组上的各种类型的基因组变异。申请人研究如何综合使用第二代和第三代测序技术数据提高复杂型变异的计算灵敏度、准确度和精度,为精准医疗、中药现代化提供方法学支撑。.主要成果及其意义.在方法学上,申请人对一类基因组结构变异特殊形式,即与肿瘤免疫治疗密切相关的微卫星不稳定性(MSI)变异设立了系列解决方案。由于肿瘤纯度决定体细胞变异检测下限,申请人首先利用DNA甲基化数据,采用beta混合模型,精准计算肿瘤样本的纯度,从极低纯度到超高纯度整个线性范围均获得最精确结果,解决了业界面临的极端肿瘤纯度难以准确计算的难点(Bioinformatics, 2019,通讯作者)。随后,申请人系统分析MSI发生机理,采用多变量伯努利分布描述基因组微卫星区域的复制过程,并对DNA聚合酶在该区域的滑动情况进行定量模拟,成功开发了MSIsensor-pro,实现了对无正常对照样本的单个肿瘤样本进行MSI评估,对科学研究和临床应用都具有重要意义(GPB,2020,通讯作者)。.在结构变异的功能影响方面,申请人领导中英跨学科团队,经过近三年合作,于2018年在Science杂志上发表论文《鸦片罂粟基因组及吗啡喃合成途径》。申请人及其团队利用自主产生的二代和三代测序,成功完成高质量鸦片罂粟的全基因组组装;推算出罂粟高效合成吗啡喃物质的超级基因簇的形成与其基因组发生的多次结构变异事件密切相关。该超级基因簇形成过程表明物种新性状形成过程中不仅存在大量达尔文主张的微进化,也存在多次结构变异导致的跳跃式进化,为间断平衡论提供了新证据(Science, 2018,并列通讯作者,末位通讯)。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

DOI:10.3864/j.issn.0578-1752.2019.03.004
发表时间:2019

相似国自然基金

1

新型的基因组结构变异检测和显示工具的开发

批准号:31100952
批准年份:2011
负责人:赵方庆
学科分类:C0608
资助金额:24.00
项目类别:青年科学基金项目
2

复杂规则实时检测的模型和算法研究

批准号:61202477
批准年份:2012
负责人:刘燕兵
学科分类:F0206
资助金额:23.00
项目类别:青年科学基金项目
3

非模式生物基因组遗传变异的识别算法和进化基因组计算平台的建立

批准号:91131013
批准年份:2011
负责人:赵方庆
学科分类:C0608
资助金额:80.00
项目类别:重大研究计划
4

基于多检测理论融合的基因组结构变异综合检测方法

批准号:61472026
批准年份:2014
负责人:高敬阳
学科分类:F0213
资助金额:80.00
项目类别:面上项目