One of the key tasks related to proteins is the similarity comparison of protein sequences in the area of bioinformatics and molecular biology, which helps the prediction and classification of protein structure and function. However, the rapid growth of the protein sequences brought the challenges for the biologist. It is a significant and open issue in finding similar proteins from a large scale of protein database efficiently. In this project, a new encoding method of protein sequence which is based on empirical mode decomposition and windowed fractal will be investigated. In this research, the protein sequences will be firstly represented into the 1-dimensional feature vectors by their biochemical quantities. A series of hybrid method involving empirical mode decomposition, windowed fractal calculation to form the feature vector will then be studied. At last, through the similarity calculation, construction of the distance matrix and the phylogenic tree will be studied. The research results will promote the development of protein sequence comparison methods, provide valuable reference for biologists to analyze the similarity and function of protein sequences, and provide the reference for the aid of disease prediction and drug design.
生物信息学的基本任务之一是对各种生物序列进行分析。蛋白质的结构与其在生物过程中的功能是高度相关的,主要取决于蛋白质序列的组合。寻找适当和可靠的方法来分析大量的蛋白质序列数据,从大量的序列信息中获取结构、功能等知识已变得尤为重要。本项目研究是基于经验模式分解和窗口分形算法的蛋白质序列相似性分析。通过利用生物特性将蛋白质序列转换成一维特征向量,然后利用经验模式分解和窗口分形提取特征向量,通过计算特征向量之间的相似度,构造距离矩阵和物种亲缘树。本项目的研究成果将推进生物序列比较方法的发展,为生物学家分析蛋白质序列的相似性及功能性提供有价值的参考,同时为辅助疾病预测和药物设计提供借鉴。
本项目旨在开展基于经验模式分解和窗口分形算法的蛋白质序列相似性分析,为生物学家分析蛋白质序列的相似性和功能性提供了有价值的参考,推动生物序列比较方法的发展。在本项目中,我们将蛋白质序列转换为一维特征向量,然后使用经验模式分解和窗口分形提取特征向量。通过计算特征向量之间的相似度,我们构建了距离矩阵和物种亲缘树。我们的研究发现,使用经验模式分解和窗口分形算法对蛋白质序列进行相似性分析是一种有效的方法。我们的数据显示,该方法在比较大量蛋白质序列时具有较高的精度。此外,我们的研究还表明,通过使用距离矩阵和物种亲缘树,我们可以更好地了解蛋白质序列的结构和功能。本项目的研究成果还可以用于许多其他应用。例如,我们的方法可以用于对蛋白质序列进行功能预测,从而为药物设计和疾病预测提供帮助。此外,我们的研究成果也可以用于提高生物数据库的质量和准确性,为生物学家提供更加可靠的信息。在未来的研究中,我们计划继续探索基于经验模式分解和窗口分形算法的蛋白质序列相似性分析方法。我们希望能够进一步提高算法的准确性和效率,并将其应用到更多的领域中。我们相信,通过不断改进和发展我们的方法,我们最终会为生物学家和其他研究人员提供更好的工具,帮助他们更好地理解生物过程。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
监管的非对称性、盈余管理模式选择与证监会执法效率?
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
氯盐环境下钢筋混凝土梁的黏结试验研究
基于分形维数和支持向量机的串联电弧故障诊断方法
分形的分解与分形分析中的奇异性质
基于经验模式分解的旋转机械振动模式分析方法的研究
基于经验模态分解和相似性挖掘的水电机组振动故障诊断研究
分形时间序列和复杂网络的重分形分析及其在几个生物信息问题中的应用研究