Protein hydroxylation modification affects protein stability, function and protein signaling network. It plays an important role in major diseases such as cancer. Systematic studies on post-translational modification are based on specific enrichment methods to improve the abundance of modified peptides. However, it is difficult to develop a method for hydroxylation enrichment because hydroxylation has a small modification group and has little influence on the physicochemical properties of modified peptides. Additionally, there are many types of hydroxylable amino acids, which increase the difficulty of hydroxylation research. Therefore, the hydroxylation studies are currently confined to specific amino acids and limited proteins. In this project, we will study mass specificity of hydroxylated peptides and develop a algorithm for determining hydroxylation sites. Using this algorithm, we will identify highly reliable hydroxylation sites from massive data from the public protein mass spectrometry database, establish a hydroxylation-knowledge database and systematically analyze hydroxylation modification. The implementation of the project will promote a comprehensive understanding of hydroxylation and may provide a new way to study post-translational modifications.
蛋白质羟基化修饰影响蛋白质的稳定性、功能和蛋白信号网络,在肿瘤等重大疾病中起着重要作用。对翻译后修饰的系统研究一般基于特异性富集来提高修饰肽丰度。然而羟基化由于修饰基团小并且不显著改变肽的物理化学性质,所以难以特异富集。而且,可羟基化的氨基酸种类很多,也增加了羟基化研究的困难性。这些因素导致了羟基化研究目前局限在特定氨基酸和有限蛋白质。本项目拟研究羟基化肽的质谱特性,开发针对羟基化的定位算法,从公共蛋白质谱数据库的海量数据中对羟基化的信息进行提取,建立知识数据库,对羟基化修饰进行系统研究。项目的实施将促进对羟基化的全面理解,为翻译后修饰研究提供一条新的途径。
蛋白质羟基化修饰影响蛋白质的稳定性、功能和蛋白信号网络,在肿瘤等重大疾病中起着重要作用。羟基化由于难以特异富集且可修饰的氨基酸种类很多,这导致羟基化修饰难以进行系统研究。本项目通过合成羟基化多肽和对应非修饰多肽、利用公共质谱数据库中的大数据,和细胞表达特定蛋白,对羟基化修饰进行了较为系统的研究。我们发现了氨基酸羟基化修饰的色谱质谱特征。与非修饰肽相比,大多数修饰氨基酸使得保留时间提前,而酪氨酸修饰不影响保留时间,组氨酸修饰推后了保留时间。此外,羟基化修饰肽的质谱谱峰强度和数量与非修饰肽非常相近,几乎不影响谱峰的变化。以上两个特性有助于识别氨基酸羟基化修饰肽。我们还开发了质谱谱图比较的自动化显示软件。这个软件的功能不限于展示羟基化修饰,也可以自动展示其他蛋白质翻译后修饰类型。此外,我们利用深度学习技术开发了修饰位点鉴定算法。我们也开发了从质谱大数据中搜索修饰位点的算法,发现了众多位点,包括了多个已经报道的羟基化修饰位点,并发现了多个新的修饰位点。我们选取了潜在的功能位点,发现羟基化修饰与VHL导致蛋白的降解密切相关。这些研究为进一步系统探索羟基化修饰奠定了基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
基于串联质谱数据的非限制修饰蛋白质数据库搜索鉴定算法研究
细胞周期调控关键基因的肺癌易感位点鉴定及功能分析
基于多组学数据筛选和鉴定冠心病相关LncRNA、甲基化和遗传易感位点
基于串联质谱数据的多肽鉴定半监督学习并行算法研究