基因组非编码区变异与转录因子调控关系的计算分析方法研究

基本信息
批准号:61732012
项目类别:重点项目
资助金额:270.00
负责人:黄德双
学科分类:
依托单位:同济大学
批准年份:2017
结题年份:2022
起止时间:2018-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:刘滨,李政伟,李晶晶,彭辰,杨世高,王刚,吴周润,鲍文正,陈俊杰
关键词:
序列特异性深度学习转录因子基因组非编码区变异结合位点
结项摘要

Recent biological studies revealed that most complex trait-associated variants are located in non-coding regulatory regions of the genomes, where they have been shown to disrupt transcription factor (TF)-DNA binding motifs. Variable TF-DNA interactions are therefore increasingly considered as key drivers of phenotypic variation. In this project, we will focus on developing effective computational methodology for dissecting and identifying the molecular roles of non-coding genetic variants in complex traits. Firstly, based on recurrent neural network model and adversarial training principle, we will develop a novel methodology for generating artificial sequences, which can serve as high-quality negative controls for downstream analysis. Secondly, based on novel machine learning techniques such as multitask learning and structured scarcity, we will propose computational approaches for predicting motifs of heterodimers in silico. Thirdly, we will propose to predict unobserved high-throughput protein-DNA data by integrating collaborative filtering and recurrent neural network techniques. Fourthly, we will study advanced weakly supervised deep learning models that could exploit multilayered information of different types of genomic data to more precisely predict causal variants and their effects at TF binding. The outcomes of this project could be beneficial for exploration of disease markers and provide further theoretical support for the precise diagnosis and treatment of complex diseases.

近年来的生物学研究表明,大多数与性状存在显著统计相关性的遗传变异均发生于基因组的非编码区域中,这些变异有可能影响转录因子(TF)对DNA序列的识别与绑定功能,因此TF-DNA相互作用所发生的变异已被认为是性状变异的主要原因。在本项目中,我们将聚焦于通过计算方法解析非编码区遗传变异和复杂性状的关系。首先,基于递归神经网络和对抗训练原则,我们将开发新型的DNA序列生成方法,为后续下游分析提供高质量控制样本;其次,基于多任务学习和结构化稀疏等新型机器学习技术,我们将提出直接预测双聚体绑定模体的计算方法;再次,通过整合协同推荐和递归神经网络技术,我们拟研究高通量数据的补全方法;此外,我们还将研究新型深度学习网络架构,并整合多种基因组数据,以便更加精确地预测遗传突变与性状变化之间的定性关系。本项目的研究成果将有助于挖掘疾病靶点,并为复杂疾病的精确诊断和治疗提供依据。

项目摘要

非编码区突变的调控作用研究面临着若干问题,在转录因子绑定模型、转录因子与调控基因关联性以及绑定变异与表型变异关联性分析方面均存在未解决的重大挑战。在本项目中,我们聚焦于通过计算方法解析非编码区遗传变异和复杂性状的关系。首先,提出了基于递归神经网络和对抗训练的新型的DNA序列生成方法,为后续下游分析提供高质量控制样本;其次,提出了基于多任务学习和结构化稀疏等新型机器学习技术以实现预测双聚体绑定模体的任务;再次,通过整合协同推荐和递归神经网络技术以研究高通量数据的补全方法;此外,我们研究了新型深度学习网络架构,并整合多种基因组数据,以便更加精确地预测遗传突变与性状变化之间的定性关系。本课题的研究有助于解析潜在的生物调控机制以及各生命功能层之间的相互作用信息,从而为理解疾病的发病机制,设计相关药物靶点提供理论支持。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
2

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

转录组与代谢联合解析红花槭叶片中青素苷变化机制

转录组与代谢联合解析红花槭叶片中青素苷变化机制

DOI:
发表时间:
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

黄德双的其他基金

批准号:31571364
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:31071168
批准年份:2010
资助金额:35.00
项目类别:面上项目
批准号:60873012
批准年份:2008
资助金额:34.00
项目类别:面上项目
批准号:60472111
批准年份:2004
资助金额:24.00
项目类别:面上项目
批准号:69705001
批准年份:1997
资助金额:12.50
项目类别:青年科学基金项目
批准号:60173050
批准年份:2001
资助金额:17.00
项目类别:面上项目
批准号:30570368
批准年份:2005
资助金额:20.00
项目类别:面上项目
批准号:61133010
批准年份:2011
资助金额:280.00
项目类别:重点项目

相似国自然基金

1

遗传变异与选择对基因组编码区与非编码区作用模式的比较

批准号:91531306
批准年份:2015
负责人:赵方庆
学科分类:C0608
资助金额:270.00
项目类别:重大研究计划
2

猪瘟病毒基因组3“非编码区结构与功能关系的研究

批准号:30170214
批准年份:2001
负责人:肖明
学科分类:C0509
资助金额:18.00
项目类别:面上项目
3

转录因子SOX2与长链非编码RNA在基因组调控中的相互作用机制研究

批准号:31501058
批准年份:2015
负责人:侯琳琳
学科分类:C0602
资助金额:20.00
项目类别:青年科学基金项目
4

全基因组编码区遗传变异与口腔鳞癌发病风险及其机制研究

批准号:81672678
批准年份:2016
负责人:袁华
学科分类:H1804
资助金额:57.00
项目类别:面上项目