基于稀疏表达的拷贝数变异检测算法研究及其在进化遗传学中的应用

基本信息
批准号:61401352
项目类别:青年科学基金项目
资助金额:28.00
负责人:段君博
学科分类:
依托单位:西安交通大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:闫菡,崔智炜,赵璐,张军,马春排
关键词:
进化遗传学稀疏建模测序技术拷贝数变异变异检测
结项摘要

Copy number variations (CNVs) present widely in human genome, and many studies demonstrate that they are associated with diseases. In recent years next generation sequencing technique has greatly improved the detection resolution of CNVs. However, the current methods suffer from low robustness and high false positive rate. Aiming to address abovementioned issue, (1) this project aims to develop a novel method to extract and combine characteristic information from multiple aspects based on sparse modeling, and extend to analyze multiple samples jointly. (2) Furthermore, this project will study the clustering method based on CNVs to classify samples from different populations, which can discover significantly distributed variants and hence the significance of CNV in the population genetics and evolutionary genetics. This study involves sparse signal processing, bioinformatics, genomics, employs methods from multiple disciplines, providing theoretical foundations and practical tools for CNV studies.

拷贝数变异广泛存在于人类基因组中,许多研究表明拷贝数变异与疾病相关联。近年来高通量测序技术极大地提高了拷贝数变异检测的分辨率。然而现有的方法普遍存在鲁棒性差及假阳性率偏高的问题。针对上述问题,(1)本项目拟用稀疏表达模型设计一个新型的方法来提取并有机融合数据内多方面特征信息,并将该方法扩展至多样本的联合分析。(2)同时作为一个重要延伸,本项目还将研究针对拷贝数变异的聚类分析方法,用以分类多个来自不同群体的样本,从而寻找分布存在显著差异的变异,最终研究拷贝数变异在群体遗传及进化遗传中的意义。本项研究横跨稀疏信号处理、生物信息学、基因组学,采用多学科的方法,为拷贝数变异的研究提供理论支持和实用工具。

项目摘要

稀疏表达模型是近年来信号处理的一个热门研究方向,在科学研究及工程技术领域得到了广泛应用。通过稀疏表达模型可以压缩、提取基因组学数据中的特征信息,克服鲁棒性差的问题,为基因组学的研究提供新的思路。本项目以稀疏表达模型为理论工具,根据新一代测序技术数据的特征,系统研究了人类基因组中拷贝数变异的检测方法,取得了如下成果:(1)在稀疏表达模型理论上证明了广义的LASSO模型在一定的条件下等价于经典的LASSO模型;(2)针对新一代测序数据的分段波松分布特性及拷贝数变异的特征,提出了一种可并行化的基于动态规划的通用优化算法;(3)针对基因组外显子测序数据,提出了基于矩阵低秩分解稀疏表达的拷贝数变异检测模型;(4)作为本项目研究的一个副产品,我们将稀疏表达模型经过适当改进,成功应用于医学超声成像。这些结果为稀疏表达模型的理论研究及拷贝数变异的临床应用起到了极大的推动作用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

DOI:
发表时间:2020
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

相似国自然基金

1

基于稀疏表达模型的多组学数据融合研究及其在拷贝数变异相关疾病的应用

批准号:61771381
批准年份:2017
负责人:段君博
学科分类:F0124
资助金额:62.00
项目类别:面上项目
2

面向测序技术的外显子组拷贝数变异检测算法研究与应用

批准号:31301092
批准年份:2013
负责人:林勇
学科分类:C0608
资助金额:23.00
项目类别:青年科学基金项目
3

稀疏典型相关分析的快速算法及其在基因表达数据分析中的应用

批准号:11571074
批准年份:2015
负责人:彭拯
学科分类:A0405
资助金额:50.00
项目类别:面上项目
4

稀疏矩阵积和式的算法研究及其在物理、化学中的应用

批准号:10501030
批准年份:2005
负责人:梁恒
学科分类:A0502
资助金额:15.00
项目类别:青年科学基金项目