DNA甲基化测序数据差异分析及meQTL定位方法研究

基本信息
批准号:61802209
项目类别:青年科学基金项目
资助金额:26.00
负责人:朴永俊
学科分类:
依托单位:南开大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:罗娜,周唯,高瑞芳
关键词:
meQTL新一代测序技术数据挖掘表观遗传学DNA甲基化
结项摘要

Whole-genome bisulfite sequencing has become a standard method to measure DNA methylation on genome-wide scale. However, our preliminary experimental results show that there are still several problems in data analysis methods. Moreover, there is a great demand in developing computational methods to link DNA methylation to genetic variations. In this research project, we will focus on a comprehensive evaluation of various differentially methylated region detection methods to lay out the effect of sequencing depth and the number of replicates on data analysis for helping researchers to choose appropriate analysis method. We will develop a non-parametric differential analysis method using data mining techniques. Additionally, we will develop a meQTL analysis tool by integrating DNA methylation and genomic data to enable accurate and fast detection of epigenetic regulatory regions. We believe that our research will greatly improve the efficiency of methylation data analysis and provide new insights into the pathogenesis of various diseases.

全基因组重亚硫酸盐测序现已成为研究DNA甲基化的标准方法。然而,本课题组从预实验发现,甲基化数据分析仍存在众多问题,且尚缺乏与基因组学数据整合分析方法。本课题利用大量全基因组重亚硫酸盐测序数据广泛分析差异甲基化区域识别算法,研究测序深度、样本数量等因素对差异甲基化分析的影响,揭示明确的全基因组重亚硫酸盐测序数据分析流程,解决科研人员无法正确选择最合适数据分析方法的问题。另外,拟采用数据挖掘技术中的特征选择方法,开发新的非参数化差异甲基化分析算法,并且研究整合差异甲基化区域和遗传变异位点的方法,开发meQTL分析工具,从而更准确、快捷的发现潜在参与表观调控的功能区域。本项目的成功实施将大大提高甲基化测序数据分析效率以及基因测序数据解读技术发展,为人类重大疾病组学大数据分析提供新思路。

项目摘要

随着新一代测序技术的不断成熟,全基因组重亚硫酸盐测序(WGBS)已成为研究DNA甲基化的标准方法。国内外均无研究探索最佳WGBS数据分析流程及各种测序因素对差异甲基化分析的影响。而且已有数据分析算法全部是基于参数化方法,存在参数推测困难、未知实际数据分布等问题,导致分析结果有一定误差,且在低深度、少样本数据中的统计功效大幅度下降。为此,本项目首先收集了大量人类和小鼠全基因组重亚硫酸盐测序(WGBS)数据,并建立了可模拟不同测序环境的WGBS数据模拟器,利用模拟及实验数据广泛分析查找差异甲基化区域算法,探究了测序深度、样本数量等因素对差异甲基化分析的影响。另外,本项目利用数据挖掘技术中的ReliefF特征选择方法,开发了新的非参数化差异甲基化分析工具,从而更准确、快捷的发现潜在参与表观调控的功能区域。此外,本项目建立了一系列DNA甲基化与其他组学数据的整合分析体系,包括可识别差异甲基化基因、表型相关甲基化位点、meQTL等关键功能位点。最后,本项目利用开发的组学整合分析体系,开展了应用研究,分别在宫颈癌和肺癌组学数据中挖掘了高敏感肿瘤检测甲基化位点。综上,本项解决了科研人员无法正确选择最合适数据分析方法的问题,突破了现有研究仅采用参数化统计学技术的局限,为其他组学测序整合分析应用提供了新的问题解决思路。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

DOI:
发表时间:2020
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

朴永俊的其他基金

相似国自然基金

1

基于MeRIP-Seq测序数据的RNA差异甲基化分析方法研究

批准号:61902230
批准年份:2019
负责人:刘恋
学科分类:F0213
资助金额:27.00
项目类别:青年科学基金项目
2

基于小样本的RNA甲基化测序数据高分辨率差异分析方法研究

批准号:61401370
批准年份:2014
负责人:孟佳
学科分类:F0124
资助金额:28.00
项目类别:青年科学基金项目
3

高通量DNA甲基化测序数据的处理及功能基因组区域识别研究

批准号:61203262
批准年份:2012
负责人:苏建忠
学科分类:F0605
资助金额:27.00
项目类别:青年科学基金项目
4

基于第二代测序技术的DNA甲基化数据挖掘分析新方法的研究及网络服务器的搭建

批准号:31000584
批准年份:2010
负责人:李茹姣
学科分类:C0609
资助金额:20.00
项目类别:青年科学基金项目