Type IV secretion systems (T4SS) exist in many pathogens such as Bartonella, which transport various effectors into host cells to evade the defense of hosts and increase bacterial survival. Identification of T4SS effectors is extremely important to reveal the mechanisms of bacterial pathogenicity. Most of existing methods are experiment-based, which are not cost-effective for fast T4SS effector identification in a large number of pathogen genomes. The absence of accurate bioinformatics prediction methods is keeping this problem unsolved. In our previous studies, we have established an effector dataset and computed position specific features of sequence residues to train a support vector machine, which can predict T4SS effectors with the accuracy of 91.9%.The result shows that universal prediction of T4SS effectors is feasible.On this basis, we will mine multi-class sequence features using computational approaches and screen feature subset using feature selection methods. An ensemble prediction model based on machine learning algorithms will be constructed. The performance of our model will be tested in datasets via cross-validation tests, as well as by literature authentication. The overall accuracy of prediction is expected to be improved, and a web server will be developed for prediction applications. In addition, a hierarchical screening method will be designed to extract effector candidates in the genome of Bartonella henselae. Some candidates will be identified by Cya-fusion experiments. One or more effectors will probably be originally discovered, which may reveal new ways of Bartonella interacting with hosts by T4SS.
巴尔通体等病原菌具备IV型分泌系统(T4SS),可转运效应蛋白至宿主细胞内,逃避宿主的防御并维持细菌生存。鉴定T4SS效应蛋白对于揭示细菌的致病机制极为重要。当前的鉴定方法以实验为主,在速度和成本上都不能满足在大量病原菌基因组内进行研究的需要,而同时也缺乏计算预测的手段来解决这一矛盾。本课题组在前期研究中,计算氨基酸位置特异性特征,构建支持向量机模型,预测T4SS效应蛋白准确度达到91.9%,表明建立普适性预测方法是可行的。本研究将在此基础上,挖掘效应蛋白的多类特征,筛选特征子集,采用机器学习算法融合策略建立预测模型,采用数据集交叉验证和文献验证评估预测性能,进一步提高预测精度并开发web预测程序。此外,以汉赛巴尔通体为对象,建立分层分类模型,在其基因组内预测候选效应蛋白,采用Cya-fusion实验进行证实,期望鉴定1到多个新的效应蛋白分子,揭示该菌通过T4SS与宿主相互作用的新途径。
众多病原菌具备 IV 型分泌系统(T4SS),可转运效应蛋白至宿主细胞内,逃避宿主的防御并维持细菌生存。鉴定 T4SS 效应蛋白对于揭示细菌的致病机制极为重要。当前的鉴定方法以实验为主,在速度和成本上都不能满足在大量病原菌基因组内进行研究的需要,而同时也缺乏计算预测的手段来解决这一矛盾。.本项目对IV型分泌效应分子的特征进行挖掘,筛选能够有效区分效应分子蛋白质和非效应分子蛋白质的序列、结构、功能等方面的特征信号,采用机器学习技术建立分类模型,开发准确的分类算法,应用于细菌全基因组效应分子的筛选,促进细菌分泌系统效应分子的鉴定和功能研究。.在本项目研究中,我们首先建立了细菌IV型分泌系统效应分子数据集,然后设计了一种新的蛋白质序列特征提取方法。该方法计算蛋白质序列的位置特异性迭代打分矩阵,提取氨基酸序列的位置特异性保守信息,并采用自相关函数来获得上下游氨基酸之间的相关性特征,进一步与氨基酸组成特征相结合,采用特征提取技术筛选出用于分类的效应分子蛋白质的特征向量。我们建立基于支持向量机的机器学习分类模型,在数据集上进行了全面测试和评估。最终的分类模型预测IVA型和IVB型效应分子的预测准确度分别达到93.3%和95.9%,敏感性分别达到76.8%和89.7%。我们进一步开发了算法和WEB预测程序,发布在http://bioinfo.tmmu.edu.cn/T4EffPred 。利用该预测算法,在汉塞巴尔通体基因组内预测到47个潜在的效应分子蛋白,通过进化分析,发现这47个分子与已知的效应分子之间存在一定的关联。.我们的主要研究结果发表在《Bioinformatics》上面,这是已知的第一个能同时预测IVA和IVB型效应分子的预测算法,同时我们建立了WEB预测服务器,为相关领域研究者提供了快速和准确的细菌IV型分泌系统效应分子预测工具。.此外,我们还基于IVB型效应分子的C末端保守模式,设计了一种新的机器学习分类模型,可以用于快速鉴定具有这种C末端保守模式的蛋白质,也可以用于在基因组内预测IVB型效应分子,从而为这类效应分子的筛选提供了另一种可选择的工具。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
特斯拉涡轮机运行性能研究综述
基于SSVEP 直接脑控机器人方向和速度研究
低轨卫星通信信道分配策略
中国参与全球价值链的环境效应分析
基于特征挖掘和机器学习的细菌VI型分泌系统效应分子的功能分类、计算预测和实验验证
幽门螺杆菌IV型分泌系统效应蛋白的鉴定及其功能的研究
羊无浆体IV型分泌系统效应分子的鉴定及功能研究
基于Split-GFP技术的幽门螺杆菌IV型分泌系统效应蛋白鉴定及转运识别机制研究