基因组非编码区变异与转录因子调控关系的计算分析方法研究

基本信息

批准号：61732012

项目类别：重点项目

资助金额：270.00

负责人：黄德双

学科分类：

依托单位：同济大学

批准年份：2017

结题年份：2022

起止时间：2018-01-01 - 2022-12-31

项目状态：已结题

项目参与者：刘滨,李政伟,李晶晶,彭辰,杨世高,王刚,吴周润,鲍文正,陈俊杰

关键词：

序列特异性深度学习转录因子基因组非编码区变异结合位点

结项摘要

Recent biological studies revealed that most complex trait-associated variants are located in non-coding regulatory regions of the genomes, where they have been shown to disrupt transcription factor (TF)-DNA binding motifs. Variable TF-DNA interactions are therefore increasingly considered as key drivers of phenotypic variation. In this project, we will focus on developing effective computational methodology for dissecting and identifying the molecular roles of non-coding genetic variants in complex traits. Firstly, based on recurrent neural network model and adversarial training principle, we will develop a novel methodology for generating artificial sequences, which can serve as high-quality negative controls for downstream analysis. Secondly, based on novel machine learning techniques such as multitask learning and structured scarcity, we will propose computational approaches for predicting motifs of heterodimers in silico. Thirdly, we will propose to predict unobserved high-throughput protein-DNA data by integrating collaborative filtering and recurrent neural network techniques. Fourthly, we will study advanced weakly supervised deep learning models that could exploit multilayered information of different types of genomic data to more precisely predict causal variants and their effects at TF binding. The outcomes of this project could be beneficial for exploration of disease markers and provide further theoretical support for the precise diagnosis and treatment of complex diseases.

近年来的生物学研究表明，大多数与性状存在显著统计相关性的遗传变异均发生于基因组的非编码区域中，这些变异有可能影响转录因子（TF）对DNA序列的识别与绑定功能，因此TF-DNA相互作用所发生的变异已被认为是性状变异的主要原因。在本项目中，我们将聚焦于通过计算方法解析非编码区遗传变异和复杂性状的关系。首先，基于递归神经网络和对抗训练原则，我们将开发新型的DNA序列生成方法，为后续下游分析提供高质量控制样本；其次，基于多任务学习和结构化稀疏等新型机器学习技术，我们将提出直接预测双聚体绑定模体的计算方法；再次，通过整合协同推荐和递归神经网络技术，我们拟研究高通量数据的补全方法；此外，我们还将研究新型深度学习网络架构，并整合多种基因组数据，以便更加精确地预测遗传突变与性状变化之间的定性关系。本项目的研究成果将有助于挖掘疾病靶点，并为复杂疾病的精确诊断和治疗提供依据。

项目摘要

非编码区突变的调控作用研究面临着若干问题，在转录因子绑定模型、转录因子与调控基因关联性以及绑定变异与表型变异关联性分析方面均存在未解决的重大挑战。在本项目中，我们聚焦于通过计算方法解析非编码区遗传变异和复杂性状的关系。首先，提出了基于递归神经网络和对抗训练的新型的DNA序列生成方法，为后续下游分析提供高质量控制样本；其次，提出了基于多任务学习和结构化稀疏等新型机器学习技术以实现预测双聚体绑定模体的任务；再次，通过整合协同推荐和递归神经网络技术以研究高通量数据的补全方法；此外，我们研究了新型深度学习网络架构，并整合多种基因组数据，以便更加精确地预测遗传突变与性状变化之间的定性关系。本课题的研究有助于解析潜在的生物调控机制以及各生命功能层之间的相互作用信息，从而为理解疾病的发病机制，设计相关药物靶点提供理论支持。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2020

DOI：

发表时间：2021

DOI：10.7498/aps.70.20202116

发表时间：2021

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：

发表时间：2020

黄德双的其他基金

批准号：31571364

批准年份：2015

资助金额：63.00

项目类别：面上项目

批准号：31071168

批准年份：2010

资助金额：35.00

项目类别：面上项目

批准号：60873012

批准年份：2008

资助金额：34.00

项目类别：面上项目

批准号：60472111

批准年份：2004

资助金额：24.00

项目类别：面上项目

批准号：69705001

批准年份：1997

资助金额：12.50

项目类别：青年科学基金项目

批准号：60173050

批准年份：2001

资助金额：17.00

项目类别：面上项目

批准号：30570368

批准年份：2005

资助金额：20.00

项目类别：面上项目

批准号：61133010

批准年份：2011

资助金额：280.00

项目类别：重点项目

相似国自然基金

遗传变异与选择对基因组编码区与非编码区作用模式的比较

批准号：91531306

批准年份：2015

负责人：赵方庆

学科分类：C0608

资助金额：270.00

项目类别：重大研究计划

猪瘟病毒基因组3“非编码区结构与功能关系的研究

批准号：30170214

批准年份：2001

负责人：肖明

学科分类：C0509

资助金额：18.00

项目类别：面上项目

转录因子SOX2与长链非编码RNA在基因组调控中的相互作用机制研究

批准号：31501058

批准年份：2015

负责人：侯琳琳

学科分类：C0602

资助金额：20.00

项目类别：青年科学基金项目

全基因组编码区遗传变异与口腔鳞癌发病风险及其机制研究

批准号：81672678

批准年份：2016

负责人：袁华

学科分类：H1804

资助金额：57.00

项目类别：面上项目

基因组非编码区变异与转录因子调控关系的计算分析方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

奥希替尼治疗非小细胞肺癌患者的耐药机制研究进展

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

非牛顿流体剪切稀化特性的分子动力学模拟

现代优化理论与应用

强震过程滑带超间隙水压力效应研究:大光包滑坡启动机制

黄德双的其他基金

转录因子结合位点序列基元挖掘的计算方法研究

基于多分类器集成及流形学习校准的蛋白质相互作用预测方法研究

面向高复杂异构数据的新的特征提取与分类方法的研究

一种新的先验信息编码的约束学习算法的研究

基于信息熵理论的前馈神经网络分类器结构优化

径向基概率神经网络的遗传选择和优化

蛋白质远程同源检测中的核方法研究

基于机器学习的蛋白质相互作用与功能预测方法研究

相似国自然基金