With the development and application of high-throughput technologies, omics data in public databases are much more than any lab capable of producing data, and have a wealth of biological knowledge content. In addition, integration of these public data sets will provide broader biological views and insights than using a single set of data. However, the massive accumulation of information and diverse technology platforms pose multiple challenges for data processing. It is urgent and necessary to find suitable methods and ideas for high-throughput data integration. In order to integrate the plant epigenome and transcriptome data sets from public available database and our own lab, we need develop a standardization analysis process and custom visualization platform, establish computational tools for plant gene annotation and motif analysis, and build a comprehensive platform for plant epigenome and transcriptome data integration and data mining, then globally study the relationship between plant epigenetic modification marks and transcription regulation. In the meanwhile, we will use the platform to elucidate the possible molecular mechanisms underlying the plant temporal (such as circadian rhythm, leaf senescence, and so on) epigenomic changes and dynamics regulation of gene expression. We try to identify the critical factors regulating the temporal gene transcription. Furthermore, we will conduct cross-species epigenome analyses (including Arabidopsis, rice and corn). In a word, the integration and data mining platform of plant epigenome and transcriptome will have enormous benefits for the in-depth studies of plant gene regulatory networks in future.
随着高通量技术的发展与应用,公共数据库中的组学数据比任何一个实验室能产生的数据都多,具有更丰富的知识含量,并将提供更开阔的生物学研究视角。然而,信息的海量积累和技术平台的多样性给数据处理带来了多重挑战,急需数据整合的方法和思路。我们针对公共数据库现有的和自行产生的植物表观基因组和转录组学数据,制定标准化分析流程,定制可视化平台,研发以植物基因功能注释和motif分析为主的分析工具,构建一个植物表观基因组和转录组数据整合与挖掘平台,进而从总体上对表观遗传标记与转录调控相关性进行分析。在此基础上,针对植物时序(如昼夜节律变化,叶片衰老等)的动态基因表达调控和表观遗传变化的规律进行探索,以期发现时序转录调控的关键因子,并尝试跨物种表观基因组比较分析(包括拟南芥、水稻和玉米)。植物表观基因组和转录组数据整合与挖掘平台的构建将对植物基因调控网络的深入研究有巨大的裨益。
植物表观基因组和转录组数据整合与挖掘平台的构建及其时序动态规律的探索有助于植物功能基因组学的深入研究。在本项目执行期间,我们利用自行产生的和公共数据库现有的植物表观基因组和转录组学数据,制定标准化分析流程,定制可视化平台,建立了一个以染色质状态为基础的表观基因组数据整合分析平台和以基因网络为主干的转录调控分析平台,辅以自行研发的相关基因功能注释与分析工具,构成了植物表观基因组和转录组数据整合与挖掘的基础,其中包括植物染色质状态数据库、多个作物的功能基因组学数据库、植物非编码RNA数据库,agriGO分析平台升级版等。在此基础上,我们利用ChIP-seq手段首次绘制了水稻H2A.Z组蛋白变体的全基因组表观基因组学图谱,并较为系统地分析了其在不同组织和不同时间下的分布特征;我们还利用DNase-seq技术研究了拟南芥在长时间黑暗处理下染色质结构的变化情况。同时,我们还利用表观基因组学和转录组学数据,构建标准化综合分析流程,预测了拟南芥pri-miRNA的转录起始位点。并且,我们从相关的基因功能模块中挖掘出一些与时序变化相关的关键基因进行了进一步功能验证,例如具有昼夜节律变化的水稻OsSPX1基因。我们构建的植物表观基因组和转录组数据整合与挖掘平台将有助于植物基因调控网络的深入研究,以期为农业研究提供基础信息。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
硬件木马:关键问题研究进展及新动向
近 40 年米兰绿洲农用地变化及其生态承载力研究
基于表观基因组与转录组数据的整合挖掘以及基因调控网络的动态解析构建棉花基因组结构与功能注释体系
整合基因组范围代谢网络模型和转录组数据的毛竹生物质代谢通路研究
多维组学数据集成分析以探索叶片衰老的转录和表观遗传调控机制
拟南芥中构成植物表观基因组的非编码RNA的转录与加工机制