Nowadays there are too many complex diseases which are threatening the health of human beings. Identifying genetic risk factors as well as exploring the mode of inheritance for complex diseases is always an important problem that must be solved urgently. Based on the SNP data in the human genome, statisticians use association analysis methods to help and instruct geneticists in their experimental studies. With the fast development of biological technology, the type of genetic data is constantly changing. New research shows that the major proportion of heritability for disease may be explained by multiple rare variants, which however can not be detected easily by using the traditional biotechnology. Recent advances in next-generation sequencing technologies facilitate the detection of rare variants and provide us high-dimensional genetic data. However, curse of dimensionality and low frequency of rare variants in the data pose a new challenge to the traditional statistical method. In this project, driven by high-dimensional genetic data and urgent problem in analysis of complex disease association studies, based on the existing statistical theory and methods, for the purpose of practical application, we will propose a series of novel statistical approaches for analyzing high-dimensional data in genetic association studies, investigate statistical associations between genetic variants and diseases, and discover some suspected loci that are highly related to the disease of interest. Hopefully, the results of our research can provide geneticists evidence and theory support for their further experimental studies.
人类的健康面临许多复杂疾病的威胁。定位复杂疾病的致病基因,探究复杂疾病的遗传规律一直以来都是人们关心和期待解决的问题。基于人类基因组上的多态性位点遗传数据,统计学家利用关联分析研究帮助和指导遗传学家进行实验研究。生物技术的不断革新,使得遗传数据的类型也在发生着不断的变化。最新研究指出,人类复杂疾病受着很多个突变率极低、传统技术很难检测的罕见变异位点的共同调控。近几年产生的下一代高通量测序技术为我们提供了海量的高维罕见变异遗传数据。新型遗传数据的高维性及罕见变异性给传统的统计方法提出了新的挑战。本项目以高维遗传数据及复杂疾病关联分析中期待解决的问题为驱动,已现有的统计理论与方法为基础,以实际应用为目的,建立适用于高维遗传数据关联分析的统计方法,研究遗传变异位点与疾病变量之间的统计相关性,寻找与疾病高度相关的多态性位点,为遗传学家进一步的实验研究提供理论基础和依据。
人类的健康受到许多复杂疾病的威胁。越来越多的研究表明这些常见的复杂疾病都与遗传有关。利用统计学方法分析遗传数据进而定位与复杂疾病统计相关的疑似位点一直以来都是人们关心的问题。高通量测序技术的革新为我们提供了信息量更高的新型遗传数据,其主要特点是维数高、等位基因突变率低,通常称之为高维罕见变异遗传数据。新型的遗传数据给传统的统计方法提出了挑战。本项目以复杂疾病基因定位研究中期待解决的问题为驱动,以高维罕见变异遗传数据的统计分析为目的,致力于构建新的统计模型与算法,并把其应用到实际数据分析中。我们具体研究了三部分内容:1)不同类型疾病变量与高维遗传位点间关联分析的相依多重检验方法;2)罕见变异位点关联分析的统计建模及在高维数据分析中的应用;3)多维疾病变量与高维遗传数据的统计分析方法。针对不同的研究内容,我们提出了一些新的统计方法与模型:基因组关联分析以及调整环境协变量影响的相依多重检验方法;基于代数统计的罕见变异关联分析方法;罕见变异关联分析的非参数方法;多维疾病变量与罕见变异位点间关联分析的非参数统计方法。此外,我们还研究了忽略抽样机制对医学图像全基因组关联分析的影响,给出了基因表达水平数据的统计建模以及基因定位的连锁分析统计方法。根据这些研究成果,我们撰写了一系列高质量的学术论文,除了几篇正在审稿的论文之外,大部分的论文已经正式发表。新的统计方法不仅具有一定的理论研究价值,还具有很强的应用前景,可以被广泛应用到高维遗传数据的统计分析中,指导实际工作者在实验之前有目的地挑选一些疑似的致病位点。本项目的完成不仅会推动统计学本身以及其在高维遗传数据分析中的发展,还对人类复杂疾病的治疗与预防有着非常重要的实际意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
复杂疾病基因数据的半参数建模及统计推断
复杂纵向数据的统计推断
复杂疾病非线性基因效应探测的高维统计推断模型研究
基于多层次数据整合的复杂疾病遗传关联分析方法研究