Long noncoding RNA (lncRNA) plays a vital role in various biological processes. RNA binding protein (RBP) binds to lncRNAs and directs them to act their functions in specific subcellular localizations. However, the underlying mechanism needs further investigation. In this proposal, we intend to integrate multi-omics datasets and molecular experiments to study the mechanism of RBP-mediated lncRNA subcellular localization. We propose to screen RBPs that may play an essential role in lncRNA subcellular localization using machine learning algorithms. To retrieve enriched sequence features and secondary structures by analyzing the franking of region of RBP binding sites; by leveraging the REL-seq and RNA-Protein pull down techniques, we intend to decipher the mechanism of lncRNA subcellular localization; we plan to construct a machine learning model to predict lncRNA subcellular localization by integrating the interactions between RBPs and sequence features. This study will provide new insights into how lncRNAs function through interacting with RBPs. Our research will benefit for the functional studies of lncRNAs in human disease and provide a theoretical basis for the development of new therapeutic strategies.
长链非编码RNA(lncRNA)参与调控多种细胞生理过程,RNA结合蛋白(RBP)能介导lncRNA到特定亚细胞结构发挥功能,但其作用机制有待进一步研究。本项目拟通过整合多组学数据和分子生物学实验,研究RBP介导lncRNA亚细胞定位的机制。用机器学习算法筛选对lncRNA亚细胞定位有重要作用的RBP;用序列富集算法筛选RBP结合位点邻近序列中对lncRNA亚细胞定位有重要作用的特征序列和RNA二级结构;依据特征序列,用REL-seq和RNA-Protein pull down技术解析RBP介导lncRNA亚细胞定位的机制;并根据决定lncRNA亚细胞定位的特征序列和二级结构,构建lncRNA亚细胞定位预测模型。本研究将为lncRNA如何定位到特定亚细胞结构提供新的理论依据,将有助于深入理解lncRNA在疾病发病过程中的作用,为设计、开发新药物及制定新治疗方法提供基础。
长链非编码RNA(lncRNA)是一类长度大于200个核苷酸,不编码蛋白质的转录本序列,其功能依赖于其亚细胞定位。大多数lncRNA作为重要的调控因子在细胞核内发挥功能,而部分lncRNA转运到细胞质及各细胞器中行使其功能。lncRNA序列元件及RBP是如何决定lncRNA亚细胞定位的机制尚不明确。本项目以K562和HepG2细胞为模式系统,1)通过分析亚细胞结构分层RNA-seq数据分析,建立lncRNA核内富集(NES)评分,用此方法确定11种细胞系中lncRNA的亚细胞定位分布,明确lncRNA主要分布于细胞核,而部分lncRNA保守地分布于细胞质;2)通过分析231个RBP eCLIP-seq数据,以lncRNA亚细胞定位为训练集和RBP结合lncRNA为特征集合,用随机森林算法对157个RBPs对lncRNA亚细胞定位作用的重要性进行了评分,用shRNA的方法对其中3个RBP进行敲低,通过RNA-seq测序发现YBX3、DDX3X和UPF1对部分lncRNA的亚细胞定位有作用;3)运用随机森林和SVM算法评估不同定位的lncRNA的6mer序列的重要性,发现top15的6mer序列与候选的3个RBPs的lncRNA结合位点有重合,说明所筛选6mer序列对lncRNA的亚细胞定位有潜在作用;4)构建HBB亚细胞定位报告系统,结合核质分离技术,用于验证某特定序列或序列集合对RNA分子细胞核和细胞质分布的作用。本项目通过整合组学分析,在11种细胞系中确定了lncRNA主要分布于细胞核内,但有少部分保守地分布于细胞质;lncRNA序列本身和不同RBPs的binding共同决定lncRNA的亚细胞定位。项目所用的机器学习分析方法可以拓展到其它类型RNA的研究,RBPs和lncRNA 6mer序列对lncRNA亚细胞定位的评估分析对lncRNA的功能探索有推动作用。
{{i.achievement_title}}
数据更新时间:2023-05-31
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
基于LASSO-SVMR模型城市生活需水量的预测
低轨卫星通信信道分配策略
转录组与代谢联合解析红花槭叶片中青素苷变化机制
基于多模态信息特征融合的犯罪预测算法研究
长链非编码RNA的亚细胞定位预测
长链非编码RNA在RNA结合蛋白TLS介导的DNA修复中作用机制的研究
长链非编码RNA与RNA结合蛋白的互作调控网络和功能研究
长链非编码RNA染色质结合的机制研究