RNA differential methylation analysis are helpful to reveal potential functions of mRNA methylation in regulating gene expression and splicing, and effectively guide cancer intervention. For MeRIP-Seq sequencing data, there are some problems, including inaccurate estimation of RNA methylation expression and the estimation of size factor in RNA differential methylation analysis. This project will firstly combine sequence information and genomic information, integrate deep learning and random forest classifier to construct the prediction model of RNA methylation sites and detect RNA methylation sites with high accuracy. Then a deconvolution modeling method based on reading segments is proposed to construct an estimation model of RNA methylation expression and accurately describe RNA methylation expression. Thirdly, we estimate the size factor of samples based on RNA methylation expression, construct the statistical analysis model of differential methylation based on negative binomial distribution model under small samples, and detect differential methylation of RNA with high accuracy. This project will provide an effective tool for RNA differential methylation analysis and technical support for biologists and drug developers. It has important theoretical significance and application value.
RNA差异甲基化分析有助于揭示mRNA甲基化在调控基因表达、剪切等方面所发挥的潜在功能,能够有效指导癌症的干预治疗。鉴于目前RNA差异甲基化分析中存在无法准确估计RNA甲基化表达量及样本尺寸因子的问题,本项目拟针对小样本MeRIP-Seq高通量测序数据,结合序列信息和基因组信息,融合深度学习和随机森林分类器构建RNA甲基化修饰位点预测模型,高精度检测RNA甲基化修饰位点;提出基于读段数的反卷积建模方法,构建RNA甲基化表达量估计模型,准确描述RNA甲基化表达量;基于RNA甲基化表达量估计样本的尺寸因子,构建小样本条件下基于负二项分布模型的差异甲基化统计分析模型,高精度检测RNA差异甲基化。本项目将为RNA差异甲基化分析提供有效的工具,为生物学家和药物研发者提供技术支持,具有重要的理论意义和应用价值。
MeRIP-seq技术能够在全转录组范围内描述RNA甲基化,从其高通量数据中挖掘全部RNA甲基化模式,有助于揭示mRNA甲基化在调控基因表达、剪切等方面所发挥的潜在功能,有效指导癌症的干预治疗。本项目从MeRIP-seq高通量数据及其它组学数据出发,严格按照项目计划书要求开展研究,发展了系列RNA甲基化修饰位点检测算法、提出了RNA差异甲基化分析方法,开发了RNA甲基化修饰位点预测平台、并在组学数据与疾病相关关联关系预测以及药物重定位等方面也开展了研究工作,主要取得了以下研究成果:1、针对目前RNA甲基化修饰位点检测仅利用序列特征,没有考虑其他潜在的、有用的基因组特征的问题,融合序列特征和基因组特征分别提出了内含子中m6A甲基化位点以及mRNA中m1A修饰位点预测模型;2、针对目前lncRNA中甲基化修饰位点预测精度不高的问题,提出了基于集成方法的lncRNA中甲基化修饰位点预测方法,通过融合mRNA和lncRNA预测结果实现lncRNA中甲基化修饰位点预测;3、开发了一个基于高精度基因组坐标的机器学习平台WHISTLE-Server。通过输入基因组坐标,能够方便地在线提取46个不同的基因组特征以及人类和小鼠的常规序列特征,并且支持直接的预测模型构建和用于私人或公共用途的在线使用;4、针对目前RNA差异甲基化分析仅支持成对数据集,通过调整RNA甲基化表达量、特异性参数,提出了基于负二项分布的RNA差异甲基化分析方法;5、提出了一种基于多数据融合的非负矩阵分解算法(EDNMF)来预测circRNA-疾病关联关系;6、提出了一种基于深度学习算法和自注意力机制模型的circRNA-RBP关联关系预测方法;7、提出了基于轻量级梯度提升树(LightGBM)来预测潜在的代谢物-疾病关联的方法;8、提出一种基于卷积层结合注意力机制和长短期记忆网络的多分类新冠肺炎病例检测方法;9、提出了一种基于多个药物属性的异构网络和变分图自动编码器的药物重定位方法VGAEDR。
{{i.achievement_title}}
数据更新时间:2023-05-31
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
针灸治疗胃食管反流病的研究进展
Loss of a Centrosomal Protein,Centlein, Promotes Cell Cycle Progression
基于图卷积网络的归纳式微博谣言检测新方法
Complete loss of RNA editing from the plastid genome and most highly expressed mitochondrial genes of Welwitschia mirabilis
基于小样本的RNA甲基化测序数据高分辨率差异分析方法研究
DNA甲基化测序数据差异分析及meQTL定位方法研究
RNA甲基化修饰高通量测序数据的生物信息方法开发以及RNA甲基化修饰调控网络的系统重建
基于植物全基因组亚硫酸盐测序的差异甲基化分析方法的研究