Genome-wide association study (GWAS) has been applied to wide applications in medicine and agriculture. In the forestry field, it has not been fruitful for GWAS association analysis of complex dynamic quantitative traits because of fewer researchers and fewer trees genomic resources. The project intends to expand and improve the GWAS statistical models applied in medicine to build a GWAS analysis platform for dynamic quantitative traits. It provides four kinds of statistical model to detect significant SNPs and several interaction effects, including marginal effect models, joint genome-wide effect models, joint gene-based effect models and haplotype effect models. We try to improve the computational accuracy and biological significance through the expansion of biological process functions and covariance matrices for better fitting of the dynamic quantitative traits. Finally all statistical software and analysis workflows will be integrated into the cloud computing platform of GWAS for forestry dynamic quantitative traits according to iPlant collaborative. The study also tries to answer several key issues with poplar growth and explain the genetic mechanisms through the data analysis of a hybrid population of Populus deltoides.
全基因组关联分析(GWAS)在医学和农业领域蓬勃发展,有了广泛的应用。而在林业领域,由于研究人员较少,林木基因组资源少,对于复杂的动态数量性状的GWAS关联分析还未取得成果。本项目拟扩展和改进医学领域的GWAS统计模型,构建一个能够关联林木动态数量性状的GWAS分析平台。这个分析平台包括边际效应,全基因组范围联合效应,基因范围内联合效用和单倍型效应等4个统计模型,用以检测SNP的显著水平和分析多种互作效应。通过扩充生物过程函数和协方差矩阵,更好地拟合动态数量性状,提高分析的精度和生物学意义。参考iPlant等云计算平台,将拟完成的统计软件和GWAS数据分析的工作流整合到面向林木GWAS分析的云计算平台。本研究还通过对美洲黒杨杂交群体的GWAS数据分析,力图解答影响杨树生长的几个关键问题和定位与此有关的遗传机制。
随着下一代测序(NGS)技术的成熟和应用普及,产生了大量的全基因组测序(WGS)数据,急需统计模型和计算分析平台来做全基因组关联分析(GWAS)。我们的课题定位于复杂动态数量性状与基因的关联度检测模型的构建和分析软件的开发,并将此应用于林木基因组的研究。到目前为止,我们构建了3个完整的GWAS统计模型,包括基于功能作图法的fGWAS, 面向单个基因的LSKAT, 和基于贝叶斯Lasso模型的gwas.lasso模型,同时为fGWAS模型增加了多种协方差矩阵和扩展了林木上常用的生长曲线,如Gompertz, Hossfeld IV, Monomolecular, Chapman-Richards等。除了将统计模型设计为生物统计软件包外,我们还参照XSEDE(Extreme Science and Engineering Discovery Environment)的科学计算网关(Science Gateway)体系结构,初步完成了云计算平台的构建。最终该云平台将结合多种pipeline来集成多个软件分析工具,也包括我们开发的几个模型。在项目期间,针对已有的GWAS群体数据,如美洲黑杨杂交家系群体和Framingham Heart Study中的BMI(Body mass index)数据,我们利用已有的模型进行了GWAS计算,并佐以统计模型或者软件工具为内容发表了5篇以上SCI论文。在林木应用方面,我们使用这些统计模型,对美洲黑杨杂交家系群体作了GWAS分析,确定了4个SNP与高度相关和16个SNP与胸径相关的基因。这个结果为进一步研究控制黑杨生长的基因和揭示其分子机理奠定了基础。这个研究不仅为GWAS研究者提供了多个面向复杂动态数量性状表型的统计模型和生物统计学软件包,也为林木GWAS的分析提供一个云计算平台。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
核壳结构Ag@CuxO催化剂H2辅助氨选择催化氧化性能及基于DFT与EPR技术的反应机制的动态研究
林木数量性状基因座功能作图统计模型及其在杨树中的应用
林木复杂性状系统作图计算平台构建
印迹数量性状位点定位的一般策略及在林木遗传中的应用
杉木和杨树遗传图谱构建和数量性状基因定位