Transcription factor (TF) plays a central role in gene regulation. Knowing the binding specificities of TFs is essential for developing models of the regulatory processes in biological systems and for deciphering the mechanism of gene expression. In this project, we will focus on developing new computational models of TF binding specificity by combining various types of high-throughput data. Firstly, based on tensor decomposition model, we will study the collaborative prediction of ChIP-seq data to overcome its current limitation for integrative analysis. Secondly, we will develop new approaches for modeling the sequence preferences of TFs based on structured sparsity and convex relaxation. Finally, by accounting for additional factors that will influence TF binding, such as surrounding environment and DNA shape, we will propose novel integrated predictive models for TF binding based on deep neural networks and weakly supervised learning. The outcome of this project will be helpful for understanding gene regulation and the causal mechanism of diseases.
转录因子在基因调控过程中扮演着关键角色。因此,理解决定该类蛋白质绑定行为的因素并建模其行为对于破译基因表达的机制具有重要意义。在本项目中,我们将结合多种高通量数据,研究新的转录因子绑定行为计算模型。首先,我们将基于张量分解模型,提出ChIP-seq数据的协同预测方法,以克服现有ChIP-seq数据用于整合分析时的不足。其次,我们将基于结构化稀疏和凸优化技术,提出新颖的转录因子序列偏好模型。最后,我们将根据生物学证据,提出全新的绑定区域周边环境、DNA形状等影响绑定行为的DNA结构因素的建模方法。同时结合深度学习、弱监督学习等技术,提出转录因子绑定位点整合预测模型。项目的成功实施将有助于认识基因调控机理,并帮助进一步理解疾病的因果机制。
转录因子在基因调控过程中扮演着关键角色,因此理解决定转录因子绑定行为的因素并建模其行为对于破译基因表达的机制具有重要意义。在本项目中,我们结合了多种高通量数据,研究新的转录因子绑定行为计算模型。首先,我们基于张量分解模型,将未观测到的ChIP-seq实验数据问题转化为张量完成问题,以克服现有ChIP-seq数据用于整合分析时的不足,并提出一种基于协同矩阵分解的miRNA与疾病关系预测的方法,该方法能够在较短的计算时间内达到较高的预测准确率。其次,我们将弱监督学习与机器学习和深度学习进行结合,提出新颖的转录因子序列偏好模型。最后,基于深度学习,我们根据生物学证据提出全新的绑定区域周边环境、DNA形状等影响绑定行为的DNA结构因素的建模方法。该项目的成功实施有助于认识基因调控机理,并帮助进一步理解疾病的因果机制。
{{i.achievement_title}}
数据更新时间:2023-05-31
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
内点最大化与冗余点控制的小型无人机遥感图像配准
转录组与代谢联合解析红花槭叶片中青素苷变化机制
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
氯盐环境下钢筋混凝土梁的黏结试验研究
转录因子结合位点序列基元挖掘的计算方法研究
基因组非编码区变异与转录因子调控关系的计算分析方法研究
基于概率模型的调节因子-转录因子-靶基因三元调控通路建模
基于计算机视觉的鱼类异常行为建模与识别研究