Manual interpretation has been the bottleneck for the knowledge mining from large scale and complex biological omics datasets. It is urgent to develop new bioinformatics technologies to combine omics datasets and biological literature to generate new hypotheses. Here, based on our expertise on biological networks, omics data analyses and biomedical text mining, we will present a novel biomedical knowledge graph strategy to achieve the fusion between biomedical text and omics datasets, and develop graph-based analysis algorithms (such as “random walk”) for multiple biomedical applications such as “disease gene prediction” and “drug repurposing”. This project will reduce the dependence of the dataset analyses workflow on manual interpretation, and accelerate the speed of the knowledge discovery from complex omics datasets.
人工判读已成为海量且复杂的生命组学数据知识挖掘的决速步。人们亟需可以自动快速地将组学数据中的复杂线索和文献中的分散知识结合起来, 产生生物学假设的生物信息学技术体系。为此,本项目拟在申请人之前生物分子网络研究、生命组学数据分析和生物医学文本挖掘的研究基础上,研发生物医学知识图谱进行组学数据和文献信息的融合,进而发展随机行走等图谱分析策略和软件,应用于疾病基因预测、疾病药物重定向等生物医学领域的知识挖掘问题。本项目有助于降低组学数据分析对人工判读的依赖,加快复杂生命组学数据的知识发现速度。
知识图谱技术在生物信息学数据分析中将发挥重要作用。申请人在前期生物分子网络研究、生命组学数据分析和生物医学文本挖掘的工作基础上,开展了系统的生物医学知识图谱构建与分析算法研究。建立了面向辐射应激、骨质疏松、肿瘤抵抗等特定生物学进程的系列生物医学知识图谱,并发展了基于知识图谱的泛素化修饰网络、蛋白表型预测以及药物靶标分析算法。项目总共发表SCI论文9篇,其中3篇IF>7,在Nucleic Acids Research(IF 19.16)发表论文2篇,获得软件著作权6项,作为分会主席主持3次国内生物信息学讨论会。本项目建立的多领域独有的以蛋白质为中心的知识关联网络,已经成为相关领域研究的基础资源。研发的面向高原紫外、高空微重力、核辐射等极端环境与特种损伤的基因知识库等,为相关生物与军事医学提供了数据资源,其中核辐射相关基因知识库RadAtlas在9月份Molecular Medicine发表的一篇论文中被当作重要依据单篇引用9处。由于泛素化修饰在生命体系中的普遍性,本项目建立的泛素连接酶/去泛素化酶-底物相互作用网络得到了广泛的应用,为多方面的蛋白质功能研究提供了全新线索,包括细胞发育、肿瘤免疫、肿瘤转移等。项目负责人李栋被评为北京市青年拔尖人才,军事科学院优秀教师,并牵头获得军事科学院的科研创新先进团队奖励(生物大数据创新团队)。参与本项目的王勋博士研究生获国家博士奖学金。徐浩硕士研究生获军事科学院优秀硕士论文。项目的相关研究成果通过研发的UbiBrowser 2.0,CTR-DB等6个网站进行了展示,并通过BioArtMED等微信公众号进行了宣传,阅读次数达到了6000次。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
基于知识图谱的农业大数据碎片化知识发现方法研究
政府治理大数据行为知识图谱关键技术研究
运用文本数据库中元数据关联规则进行知识发现的研究
基于知识图谱的社交媒体大数据主题发现与趋势预测关键问题研究