The main task and challenge in human biology and genetic technology is to search for genetic components associated with diseases. Supported by the rapidly developed high-throughput sequencing technologies, the association analysis between rare mutations and disease is a hot topic in the moment world. Considering the low minor allele frequency (MAF) of rare variants and its special pathogenesis, many testing methods of rare variants are proposed for population-based data analysis in recent years. Compared with the population-based design, the family-based design can circumvent the population stratification problem and control the false positive rate properly, thereby the study of rare variant analysis in family-based data has both scientific and practical significance. This project mainly studies the association analysis of the rare variants and the disease trait in trio family design. We plan to regard the rare genetic mutation as rare event, combine with Poisson approximation theory and the multi-factor dimensionality reduction method, and propose the test methods based on the TDT-type test under known and unknown genetic models respectively; Considering the HRR test, we propose weighted HRR test for association analysis of rare variants; In view of the influence brought by the common variants or the variants with different function directions, we separate genes into different groups or give weight to genes to integrate information effectively, and select out the disease associated genetic loci from lots of genetic variants effectively. The study of the project can enrich and improve the association analysis method for rare variants and disease, and provide powerful tools for detection of disease associated genes.
寻找与疾病关联的基因成分是人类生物医学研究的重要任务与挑战。基于新一代测序技术,稀有基因变异与疾病的关联性研究是当下热点研究问题。针对稀有变异的低次等位基因频率以及特殊的发病机理,近年来研究人员已提出众多基于群体设计的稀有变异检验方法。相比群体设计,家系设计不受群体分层等混淆因素影响,因此家系设计的稀有变异研究具有重要实际意义。本项目研究三元家系设计中稀有变异与疾病性状的关联性检验方法,以稀有事件看待稀有基因的变异,以泊松近似思想结合多因子降维方法,分别在基因模型已知和未知条件下提出基于TDT型检验方法的稀有变异分析方法;基于HRR检验,提出加权HRR稀有变异关联分析方法;针对关联分析中常见变异基因以及多种不同功能基因对检验的影响,对基因进行有效的分组或加权整合,并从众多基因中筛选出与疾病相关的基因位点。通过本项目研究,可丰富和完善稀有基因变异与疾病的关联分析方法,为致病基因探测提供工具。
寻找与疾病关联的基因成分一直是人类生物医学研究的重要任务与挑战。近年来高通量测序技术的飞速发展,拓宽了人们研究基因与疾病相关问题的视野,给生物信息学带来了巨大的挑战,也为探索更多生物医学等问题提供了更多的机会。本项目研究家系数据的基因变异与疾病的关联性分析问题,以及与复杂疾病如肿瘤等相关的驱动基因的探测问题,为基因的关联性分析研究和致病驱动基因的寻找提供有力的统计学分析方法。相比群体设计,家系设计不受群体分层等混淆因素影响,因此家系设计的基因变异研究具有重要实际意义。对基因关联分析中的家系数据,我们针对连锁不平衡TDT检验方法对潜在模型未知导致的检验功效低下及不稳定的情形,提出了加权TDT检验方法。由于众多与复杂疾病相关的驱动基因通常表现出互斥性,寻求基因表达中存在互斥性的基因组可以为寻找与复杂疾病相关的驱动基因提供有效的线索。为寻求互斥基因组,我们提出了互斥基因组的贪婪算法(GAME)。GAME可以对常见变异和罕见变异混杂的基因进行有效的分组,从众多基因中筛选出与疾病相关的驱动基因,可以提供更高的挑选效率,并能更好地控制I型错误。在TCGA肿瘤数据中的应用证实了该方法的有效性。GAME可以为肿瘤等疾病的成因研究提供统计方法和分析手段。此外,我们对时间序列数据中的变点检测问题和相依随机变量的序列的性质进行了分析研究。对变点问题的CUSUM型估计量,我们对它的一致性性质做了研究。对相依随机变量序列,我们对多种相依数据进行了分析,得到一批大样本极限理论。这些工作可以为我们后续对关联分析问题的研究提供新的方法和思路,并且可以在其他应用领域,譬如经济分析等问题中得到实际的应用。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
稀有变异的基因关联分析方法研究及其应用
家畜全基因组分析中稀有变异上位效应检测方法与应用研究
基于拷贝数变异的疾病易感基因定位中的统计方法研究
基于家系基因组测序数据的拷贝数变异检测方法研究