Cancer represents an enormous economic and social burden to modern society. Increasingly, it is realized that epigenetic alterations, notably DNA methylation (DNAm), contribute to the risk and progression of cancer, and that they could serve as biomarkers. However, the identification and interpretation of relevant DNAm-based biomakers is hampered by intra-sample cell-type heterogeneity...The main aim of this proposal is to develop a novel statistical cell-type deconvolution algorithm, to allow improved identification of DNAm alterations which are not driven by changes in cell-type composition. Specifically, we will explore an innovative graph deconvolution method which incorporates prior cell-type specific information as an epigenetic network. The algorithm will allow the identification of the specific cell-types and genomic loci which mediate disease-risk, in particular, we will apply it to the identification of DNAm alterations which mediate the causal link of smoking and air pollution with lung cancer. Associated software will be made publicly available, including a web-server application. This research will lead to an improved understanding of the role of DNAm alterations in the development of lung cancer and other complex diseases, as well as help identify and develop novel early detection DNA-based biomarkers, potentially measurable in future from circulating cell-free DNA.
包括癌症在内的各种复杂性疾病已成为现代社会的重要经济与社会负担。研究表明,表观遗传水平,特别是DNA甲基化的变异与复杂性疾病的发生和发展密切相关,并且可作为相关疾病的重要的生物标志物及治疗靶标。然而,对基于DNA甲基化的生物标志物的识别与获取却受到样本内细胞类型异质性的强烈干扰。..本项目拟开发新型细胞类型去卷积算法,从而消除表观基因组关联分析中样本细胞类型组成差异对DNA甲基化变异的影响。待开发算法为基于整合细胞类型先验信息的新型网络去卷积算法,该算法可用于识别复杂组织的细胞组成及其与疾病风险相关的基因组关键位点,此外,我们拟利用该算法对吸烟及污染相关的肺癌DNA甲基化位点进行识别。拟开发的相关的软件包,包括网络服务器等均将公开发布。这一研究将极大地增加我们对于DNA甲基化变异在包括肺癌在内的各种复杂性疾病中的作用的认识,进而帮助开发基于循环游离DNA的DNA甲基化相关的新型生物标志物。
细胞类型异质性是DNA甲基化数据分析领域的最大挑战之一。大量DNA甲基化数据是通过测量大块组织(bulk tissue)获得的,这些组织由不同的细胞类型组成,每种细胞类型都有特定的DNA甲基化表征。因此,DNA甲基化与表型(例如疾病、环境因素、遗传变异)的关联可能由细胞类型比例的变化造成,而且其变化可能会掩盖特定细胞类型的DNA甲基化变化。细胞类型去卷积算法提供了一种低成本的有效解决方案。该算法可以推断出大块组织中的细胞类型比例,并且在表观基因组关联研究中可以用来识别细胞类型特异的差异DNA甲基化信号。作为该项目的一部分,研究团队开发了一套细胞类型的去卷积算法,可应用于包括血液在内的各种不同的复杂组织类型。为了估计复杂组织中的细胞类型比例,研究团队开发了HEpiDISH算法。作为第一个应用分层稳健偏相关方法的算法,HEpiDISH已在唾液、口腔拭子和癌症组织等组织得到充分验证。在HEpiDISH的基础上,研究团队还开发了CellDMC算法,该算法在线性相互作用模型中使用HEpiDISH估计的细胞类型比例来推断细胞类型特异的DNA甲基化变化。研究团队已经证明,CellDMC可以准确识别多种组织类型中的细胞类型特异的DNA甲基化变化,包括血液、口腔拭子、肺和乳腺组织。作为原理证明,研究团队展示了它如何发现口腔拭子中与吸烟相关的上皮细胞和免疫细胞特异的DNA甲基化变化,而上皮细胞中的DNA甲基化变化与鳞状癌(肺鳞状细胞癌和头颈癌)的发展具有潜在的因果相关性。利用CellDMC,研究团队首次实现了在细胞谱系分辨率下的吸烟表观基因组关联研究荟萃分析,发现了髓样细胞和淋巴细胞特异性DNA甲基化变化。研究团队发现了一种新的吸烟相关的髓样细胞特异性DNA甲基化特征,该特征与炎性巨噬细胞相关,并富集在急性髓性白血病(AML)增强子区域,从而提示了吸烟与AML风险在分子水平上的联系。HEpiDISH和CellDMC是Bioconductor R包EpiDISH的一部分,用户可免费获取,也可以直接在网站上实现其功能。这些算法将有助于表观基因组数据的分析,发现DNA甲基化调控的疾病相关通路。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
基于SSVEP 直接脑控机器人方向和速度研究
拥堵路网交通流均衡分配模型
卫生系统韧性研究概况及其展望
面向云工作流安全的任务调度方法
多种类型细胞中基因组与表观基因组信息网络的综合分析
基于稀疏模型的盲去卷积问题理论与算法
遥感影像小支撑规范化去卷积快速算法研究
癌症系统表观基因组学新型生物信息统计算法研究