本项目针对生物信息学中典型的对称性预测问题,发展适合的机器学习pairwise核方法,通过度量两对对象之间的相似度,解决蛋白质相互作用、基因功能关联这两类对称预测问题。首先,构建用于客观反映pairwise核方法分类性能的数据集,通过平衡随机采样的方法构建反例数据集。然后,根据核函数的正定性约束条件,引入对称性运算,研究pairwise核的一般规律,探寻非向量形式数据类型上的最优解求解方法,并将新型核方法用于蛋白质相互作用、基因功能关联这两类预测问题。最后,将传统的直系同源方法与新型的pairwise核方法相结合,研究跨物种预测大豆蛋白质相互作用及基因功能关联的方法,丰富相应的数据。本项目对开拓新的核函数理论与预测方法、研究人工智能与分子生物学的结合都具有重要的理论意义,并在大豆分子功能理解方面具有潜在的应用价值。
生物大分子之间的互作一直是生物信息学的研究热点之一,本项目利用信息方法,针对蛋白质相互作用(Protein-protein interaction,简称PPI)、基因功能关联(Gene-gene association,简称GGA)这两个问题开展工作,并以大豆(Glycine max)、人类等组学数据为基础加以实现、验证。项目属于生物信息学、计算生物学交叉学科研究方向,取得如下重要结果:.(1)在基因功能关联预测方面,提出了一种GWAS中基于信息增益的基因-基因互作挖掘算法,在仿真数据和真实数据中进行了验证。提出了利用随机游走策略挖掘疾病风险基因的方法,为研究复杂疾病的相关基因及其作用机制提供了一种新途径。研究了组织共有eQTL的识别方法,有别于此前多项研究对组织特异eQTL的功能分析。.(2)研究了蛋白质功能预测的相关计算问题,包括基于序列和基于PPI网络的两种预测方法。首先提出了一种基于序列结构域组成的蛋白质功能预测方法,它不受其它复杂生物特征提取难度的限制。对于后者,在提出基于GO注释信息蛋白质功能相似性计算方法基础上,给出了基于结构域相互作用的PPI网络构建算法,进而完成功能预测研究。.(3)在跨物种预测大豆GGA和PPI方面,提出了一种基于靶基因网络推导大豆microRNA功能网络(miRFN)的方法,该方法也适用于其它模式或非模式生物;实现了大豆miRFN及其靶基因网络的相关信息检索与分析在线工具,将有助于在系统水平上揭示miRNA-miRNA和miRNA-基因互作机制。同时,构建了一个关于大豆功能基因网络和大豆miRNA功能网络的数据库——大豆功能网络数据库(SoyFN),受到人们关注。.(4)在机器学习相关算法研究方面,提出了一种基于SVM的主动学习算法,用来解决蛋白质相互作用的预测问题。同时,针对生物信息学中正、反例不平衡问题,给出了构造合理反例集的算法,用于基于蛋白质互作数据的基因功能推断方法。.共发表论文35篇,其中国际刊物20篇、国内核心刊物12篇、国际会议论文3篇;SCI、EI分别收录20篇、5篇。授权软件著作权2项。结合本项目研究工作,培养博士生6人(已毕业4人)、硕士生8人(已毕业6人)。.本项目将对蛋白质互作、基因互作关系预测的信息方法研究具有重要的理论意义,并可为生物学家理解大豆分子功能提供一定的借鉴。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于LASSO-SVMR模型城市生活需水量的预测
内点最大化与冗余点控制的小型无人机遥感图像配准
基于多模态信息特征融合的犯罪预测算法研究
基于分形维数和支持向量机的串联电弧故障诊断方法
蛋白质相互作用预测的集成学习方法研究
蛋白质相互作用及结合位点的预测方法研究
自相互作用蛋白质的系统研究和预测
基于机器学习的蛋白质相互作用与功能预测方法研究