It has been presumed that most frame-shifted protein coding genes yield truncated, non-functional, and potentially cytotoxic products, and the robustness of the genetic code to frameshift errors is achieved by increasing the probability that a stop codon is encountered upon a frameshifting. In this study, we found that in E coli a frame-shifted gene is still functional and the reading frame is restored gradually, suggesting that the hidden stop codons signal translational readthrough and reading frame restoration. Moreover, by analyzing all available coding genes in major model organisms, it is revealed that in any species, and in any gene, the three translation products from three different reading frames are always highly similar to each other, with a constant ~50% similarity and a ~100% coverage. Therefore, most frame-shifted coding genes are potentially functional, since in a frameshift isoform not only the protein sequence is conserved, but also the active sites can be regenerated. It is suggested that in early evolution the genetic code was optimized for frameshift tolerating, endows every coding gene a constant shiftability, and therefore, every protein has three frameshift isoforms and every life has an inherent and everlasting ability to tolerate frameshift mutations.
一直以来人们认为大多数编码基因的移码突变产生截断的、没有功能的、甚至具有潜在细胞毒性的产物蛋白。而且,遗传密码具有三个终止密码子,并且都与高丰度氨基酸的密码子重叠,大大增加了移码突变后产生终止密码子的概率,从而达到对移码突变具有鲁棒性。本项目发现在大肠杆菌中一个基因在移码突变之后仍然具备功能,并且其读码框会逐渐恢复。此外,通过分析主要模式生物基因组中所有已知的编码基因,表明任何物种,任何编码基因,从三个不同的读码框翻译得到的三个蛋白产物有恒定的约50%相似性和约100%覆盖率。因此,编码基因在移码突变后是有潜在功能的,因为在移码型蛋白质中,不仅氨基酸序列是保守的,而且活性位点能够保持不变或被再生出来。表明在生命早期进化中,遗传密码为容忍移码突变而优化过,赋予了每个编码基因一个恒定不变的可移位性,因此,每个蛋白有三个移码型,而且每个生物体都有一种内在的和永恒的容忍移码突变的能力。
移码突变通常导致一个蛋白编码基因功能的丧失,通常认为恢复突变是由随机突变引起,发生几率比正向突变少得多。但是,本研究在大肠杆菌中进行筛选测试表明,移码突变的回复率大大高于预期。对质粒进行Sanger测序和高通量测序表明,移码突变的回复不可能由随机突变引起,而可能是一种主动性的和靶向性的基因修复。通过分子研究、基因组重测序和转录组分析,我们提出了移码突变修复的新模型,称为无义介导的基因编辑(NMGE):无义mRNA中的PTC信号被识别,无义mRNA被编辑修复,然后通过错配修复和同源重组,用于指导修复其有缺陷的编码基因。此外,NMGE还是一种新的分子进化机制,是遗传多样性的新来源,导致移码同源基因和蛋白的广泛存在。.此外,我们通过多种模式生物的基因组大数据分析和计算生物学进一步证实可移位性在各种生物中普遍广泛存在,发现更多与遗传密码和编码基因可移位性有关的重要证据:(1)编码基因的三个阅读框中编码的三个蛋白质序列之间存在平均50%的相似性,这主要由遗传密码决定;(2)在标准遗传密码中,分配给移码密码子替换的氨基酸替换比分配给随机替换的氨基酸替换要保守得多;(3)标准遗传密码的移码耐受性在所有可能的遗传密码中排名前1.0-5.0%,表明天然遗传密码在移码耐受方面是最优的;(4)在酵母和某些动植物基因组中,耐受移码突变的密码子和密码子对出现频率较高,密码子和密码子对的偏好性进一步提高了编码基因的可移位性;(5)编码基因中“隐藏的终止密码子(HSCs)”较多地聚集在蛋白质活性位点附近;(6)HSCs在进化过程中被替换为一定的氨基酸类型,除高丰度氨基酸外,与蛋白质活性位点的氨基酸类型高度重叠。.本项目研究证明了在生命早期进化中,在遗传密码、基因和基因组层面均为容忍移码突变而优化过,存在可移位性。自然遗传密码的“精妙设计”赋予了每个编码基因可移位性,使生物获得了一种内在的和永恒的耐受移码突变的能力,使任何物种的任何基因都能够在一定程度上容忍部分移码突变,从而在早期进化过程中赢得生存竞争,最终形成了现在所有生物通用的遗传密码。遗传密码的可移位性对蛋白质及其编码基因的表达、功能、修复和进化有十分重要的意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
监管的非对称性、盈余管理模式选择与证监会执法效率?
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
针灸治疗胃食管反流病的研究进展
非线性移位寄存器及相关密码算法研究
基于线性移位寄存器流密码研究
保护数据隐私性及抗量子密码分析的可搜索加密研究
流密码可约性高效判别算法存在性的研究