Whole-genome bisulfite sequencing has become a standard method to measure DNA methylation on genome-wide scale. However, our preliminary experimental results show that there are still several problems in data analysis methods. Moreover, there is a great demand in developing computational methods to link DNA methylation to genetic variations. In this research project, we will focus on a comprehensive evaluation of various differentially methylated region detection methods to lay out the effect of sequencing depth and the number of replicates on data analysis for helping researchers to choose appropriate analysis method. We will develop a non-parametric differential analysis method using data mining techniques. Additionally, we will develop a meQTL analysis tool by integrating DNA methylation and genomic data to enable accurate and fast detection of epigenetic regulatory regions. We believe that our research will greatly improve the efficiency of methylation data analysis and provide new insights into the pathogenesis of various diseases.
全基因组重亚硫酸盐测序现已成为研究DNA甲基化的标准方法。然而,本课题组从预实验发现,甲基化数据分析仍存在众多问题,且尚缺乏与基因组学数据整合分析方法。本课题利用大量全基因组重亚硫酸盐测序数据广泛分析差异甲基化区域识别算法,研究测序深度、样本数量等因素对差异甲基化分析的影响,揭示明确的全基因组重亚硫酸盐测序数据分析流程,解决科研人员无法正确选择最合适数据分析方法的问题。另外,拟采用数据挖掘技术中的特征选择方法,开发新的非参数化差异甲基化分析算法,并且研究整合差异甲基化区域和遗传变异位点的方法,开发meQTL分析工具,从而更准确、快捷的发现潜在参与表观调控的功能区域。本项目的成功实施将大大提高甲基化测序数据分析效率以及基因测序数据解读技术发展,为人类重大疾病组学大数据分析提供新思路。
随着新一代测序技术的不断成熟,全基因组重亚硫酸盐测序(WGBS)已成为研究DNA甲基化的标准方法。国内外均无研究探索最佳WGBS数据分析流程及各种测序因素对差异甲基化分析的影响。而且已有数据分析算法全部是基于参数化方法,存在参数推测困难、未知实际数据分布等问题,导致分析结果有一定误差,且在低深度、少样本数据中的统计功效大幅度下降。为此,本项目首先收集了大量人类和小鼠全基因组重亚硫酸盐测序(WGBS)数据,并建立了可模拟不同测序环境的WGBS数据模拟器,利用模拟及实验数据广泛分析查找差异甲基化区域算法,探究了测序深度、样本数量等因素对差异甲基化分析的影响。另外,本项目利用数据挖掘技术中的ReliefF特征选择方法,开发了新的非参数化差异甲基化分析工具,从而更准确、快捷的发现潜在参与表观调控的功能区域。此外,本项目建立了一系列DNA甲基化与其他组学数据的整合分析体系,包括可识别差异甲基化基因、表型相关甲基化位点、meQTL等关键功能位点。最后,本项目利用开发的组学整合分析体系,开展了应用研究,分别在宫颈癌和肺癌组学数据中挖掘了高敏感肿瘤检测甲基化位点。综上,本项解决了科研人员无法正确选择最合适数据分析方法的问题,突破了现有研究仅采用参数化统计学技术的局限,为其他组学测序整合分析应用提供了新的问题解决思路。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
硬件木马:关键问题研究进展及新动向
端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于MeRIP-Seq测序数据的RNA差异甲基化分析方法研究
基于小样本的RNA甲基化测序数据高分辨率差异分析方法研究
高通量DNA甲基化测序数据的处理及功能基因组区域识别研究
基于第二代测序技术的DNA甲基化数据挖掘分析新方法的研究及网络服务器的搭建