Transcription factors play a central role in regulating gene transcription. Mutations in transcription factors or in DNA binding sequences in promoters lead to a variety of diseases. Only in recent years, high-throughput approaches enable us to identify protein-DNA interactions in a large scale. In our previous research, we systematically characterized protein-DNA interactions using high-throughput protein microarrays. To further understand the mechanism of how amino acids in transcription factors interact with DNA sequences, we propose a combined computational and experimental approach to identify key amino acids that specify DNA binding preferences of transcription factors. Our preliminary analysis showed that amino acids on the DNA contacting surface of transcription factors are important in controlling DNA binding specificity. Surprisingly, we further identified several key amino acids that are far away from the DNA contacting surface ("long-range") also are important in specifying DNA binding preferences. Our preliminary analysis also, for the first time, provided evidence that this type of "long-range" amino acids are typically continuous on the tertiary structure and are evolutionarily coevolved. We propose to further experimentally validate the functions of "long-range" amino acids and to extend our analysis to all the other major transcription factor families such as HLH and bZIP. Our study will deepen our understanding in rules specifying DNA binding preferences of transcription factors and will provide important insights into transcriptional dysfunction related diseases.
转录因子在基因转录调控中起着十分重要的作用。转录因子的缺陷或与靶DNA序列的错误结合会引起基因转录失调,从而导致各种的疾病发生。我们在过去的研究中,利用高通量蛋白质芯片首次大规模地鉴定了蛋白质对DNA序列的结合谱。为了进一步揭示转录因子和DNA序列相互结合的机制,本项目拟结合高通量转录因子DNA结合数据及转录因子DNA复合体晶体结构, 采用生物信息和生物实验相结合的手段,发现并验证转录因子序列上影响DNA结合特异性的关键氨基酸位点及其对DNA结合特异性的影响。除了证实传统认为的与DNA交界面上的氨基酸位点对DNA的调控机制,需要强调的是,本项目的前期工作首次提供了共进化的氨基酸位点对DNA结合有远程调控作用的证据,我们将进一步深入研究其潜在机理。本项目的研究思路强调系统性和全面性,预期研究结果将突破传统理论认识,有助于加深基因转录调控机制的理解,为转录失控相关的疾病的发生机制提供重要线索。
通过蛋白结构域特异性结合DNA序列,转录因子可特异地调控基因表达。为了维持DNA结合特异性,转录因子在结构上和序列上的特性可以保证其准确地识别DNA结合位点。然而,转录因子结构域氨基酸位点的共进化同DNA结合间的相互关系仍未深入研究。本研究假设“转录因子DNA结合域内氨基酸共进化与转录因子-DNA结合特异性相关”。为了检验此假设,我们系统收集了已发表的转录因子-DNA结合数据,这些数据均来自于蛋白质结合芯片(PBM)、细菌单杂交系统(B1H)和指数级富集配体进化技术(SELEX)。经过严格统一的数据预处理策略,我们共获得903个转录因子及其DNA模序数据,这些数据主要来自于小鼠(38.3%)、人(19.2%)、果蝇(26.9%)、酵母(11.4%)和秀丽线虫(4.2%)。数据共包含九个转录因子家族,其中前三个最大的蛋白质家族有Homeobox(32.6%)、zf-C2H2(21.9%)和HLH(13.6%)。首先,我们系统分析了转录因子亚家族的结合异质性,并识别了亚家族特异性决定位点(SDS);两阶SDS氨基酸对子的Fisher确切检验发现关键氨基酸位点的氨基酸类型和频率具有显著相关性。进而,我们采用集成的共进化分析策略深入分析了关键氨基酸位点的共进化趋势。研究发现,对于所有转录因子超家族,转录因子DNA结合域中超过85%的氨基酸位点受到共进化约束。共进化不仅发生在特异性氨基酸位点间,还发生在非特异性氨基酸位点中。通过序列和结构比对算法,我们将共进化氨基酸位点比对到已知的转录因子-DNA复合物晶体结构上。结构分析发现,临近的氨基酸位点倾向以“块”的形式共进化;值得注意的是,我们发现有部分空间距离较大的氨基酸位点也会发生共进化。计算机突变模拟分析发现,对于空间上间隔较远的共进化氨基酸位点,突变任一氨基酸位点或DNA结合序列碱基都会破坏转录因子-DNA复合物的稳定性。这些研究揭示了转录因子DNA结合域内氨基酸位点的共进化对DNA特异性结合具有重要作用,证实了我们的假说。我们的研究拓展了当前关于“转录因子-DNA特异性结合”的认知,对基因转录调控研究具有一定的理论推动意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
内点最大化与冗余点控制的小型无人机遥感图像配准
转录组与代谢联合解析红花槭叶片中青素苷变化机制
氯盐环境下钢筋混凝土梁的黏结试验研究
丙二醛氧化修饰对白鲢肌原纤维蛋白结构性质的影响
高通量研究Sox/POU转录因子二聚体与DNA序列库的结合调控作用
转录因子结合位点序列基元挖掘的计算方法研究
真核转录因子与基因组序列变构结合模型研究
结合甲基化DNA的转录因子识别及其调控功能研究