Now ChIP-Seq experiment is widely used to characterize the genome-wide binding pattern of chromatin-associated proteins such as histone modifications and transcription factors, and comparing the ChIP-Seq samples of these factors across different cell types has become a key step towards understanding the mechanism of cell type-specific transcriptional regulation. However, computational tools for quantitative comparison of ChIP-Seq data sets are still underdeveloped in terms of both variety and scope of application, which has strongly restricted the progress of associated studies that need to perform precise comparison based on replicates or comparison across multiple factors/cell types. In this proposal, we plan to develop a comprehensive set of bioinformatic tools for quantitative comparison of multiple ChIP-Seq samples, which are urgently needed by the field, based on the tools previously developed by us including the MAnorm model designed for pair-wise comparison. Besides, these tools will be further integrated into a webserver to facilitate their uses.
ChIP-Seq实验已被广泛用于在全基因组尺度上刻画组蛋白修饰和转录因子等染色质结合蛋白的染色质结合。在不同细胞类型之间比较这些调控因子的全基因组结合差异已成为研究细胞类型特异性基因表达调控机制的重要手段。但是,能实现ChIP-Seq数据精确定量比较的计算工具不仅数目较少,而且应用范围也远无法满足多样化的实际需求,从而局限了相关的生物学研究向单因子跨细胞类型精确比较和多因子多细胞类型同时比较等方面的发展。本项目拟在申请人已开发的ChIP-Seq数据双样本定量比较模型等计算工具和分析方法的基础上,瞄准ChIP-Seq数据多样本定量比较方面的生物信息工具缺口,开发针对性的生物信息学分析工具群,并搭建网络服务平台以利于这些工具的广泛应用。
ChIP-Seq实验被广泛用于在基因组尺度上刻画组蛋白修饰和转录因子等染色质相关蛋白的染色质结合或分布。在不同细胞类型之间比较它们的染色质结合差异是研究细胞类型特异性转录调控的重要基础。但是,能实现ChIP-Seq数据精确定量比较的计算工具不仅数目较少,而且其应用范围也难以满足多样化的实际研究应用需求,局限了相关的生物学研究向单因子跨细胞类型精确比较和多因子多细胞类型同时比较等方面的深入发展。本项目瞄准ChIP-Seq数据多样本定量比较方面的计算生物方法学薄弱环节,开发了适用于多样本ChIP-Seq数据分组定量比较的新一代MAnorm2计算模型。该模型能够对多样本ChIP/ATAC-seq数据按照用户感兴趣的样本生物学标签如年龄、性别、患病与否、疾病亚型等分组,进而进行统计建模和组间定量比较分析,可靠地在样本组层面鉴定组间显著差异的ChIP-seq信号,发掘与该生物学标签关联的特异性染色质结合位点。如果被比较的样本组内部有明显不同的总体ChIP-seq信号组内变化水平,例如当髙异质性的癌症组织样本和低异质性的正常对照组织样本进行比较时,MAnorm2通过对组内ChIP-seq信号整体变化水平定量建模,展现了相对于现有ChIP-seq差异分析工具更优越的使用性能,能够为精准刻画组织癌变过程中发生的表观基因组异变提供可靠的方法学基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
粗颗粒土的静止土压力系数非线性分析与计算方法
中国参与全球价值链的环境效应分析
转录组与代谢联合解析红花槭叶片中青素苷变化机制
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于ChIP-seq数据和系统发生信息的调控模体预测
Chip-seq数据的位点特异性模体识别算法研究与开发
整合策略预测组织细胞特异调控变异和系列生物信息学工具开发
信息系统集成化开发基础与支持工具研究