基于生物医学文献的隐含知识发现方法研究

基本信息
批准号:61272373
项目类别:面上项目
资助金额:80.00
负责人:杨志豪
学科分类:
依托单位:大连理工大学
批准年份:2012
结题年份:2016
起止时间:2013-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:杨志伟,赵晶,赵权科,李彦鹏,徐博,何林娜,王艳华,李宗耀,于凤英
关键词:
生物信息学文本挖掘信息抽取隐含知识发现实体识别
结项摘要

In the huge biomedical literature storages represented by MEDLINE, vast hidden biomedical knowledge is remaining undiscovered in the large amount of data, which offeres an excellent opportunity for the discovery of these knowledge by applying text mining technologies.Based on biomedical entity recognition and name normalization, utlizing the biomedical resources such as UMLS, MESH, GO, UniProt, DrugBank, KEGG Database,etc., our project constructs the text reprsentatives of biomedical concept space and Latent Semantic space based on Probabilistic Latent Semantic Index for the biomedical literature in MEDLINE; detects the occurrence of biomedical concepts based on information extraction and passage retrieval technologies; introduces the supervised learning method and choose rich features including Latent Semantic and biomedical semantic relation similarity, global corpus and infromation extraction statistical information to evaluate the correlation between biomedical concepts and finally achieves the hidden knowledge in the literature. Our project also implements the visualization of the hidden knowledge discovery process and establishes the platform of valuable hidden knowledge discovery based on biomedical literature.

以MEDLINE为代表的海量生物医学文献资源中,存在大量的蕴含于公开发表的文献,而尚未被人们认知的隐含知识。采用文本挖掘技术从这座宝库有效的提取隐含生物医学知识的需求变得非常迫切。本项目以MEDLINE的生物医学文献为主要数据源,在生物实体识别和名称标准化的基础上,利用UMLS、MeSH、GO、UniProt、DrugBank、KEGG Database等生物医学资源,建立基于生物医学概念的概念空间和基于概率潜在语义索引的潜在语义空间表示;利用信息抽取和段落检索技术进行医学概念共现识别;引入监督学习方法,选取包含潜在语义空间相似度、医学语义关联度和全局语料库统计量以及信息抽取的统计特征等多种特征来综合评定概念间的相关度量,最终获得生物医学文献中的隐含知识。此外,本项目将实现挖掘知识的可视化,建立具有实用价值的生物医学文献隐含知识发现平台。

项目摘要

以MEDLINE 为代表的海量生物医学文献资源中,存在大量的蕴含于公开发表的文献,而尚未被人们认知的隐含知识。采用文本挖掘技术从这座宝库有效的提取隐含生物医学知识的需求变得非常迫切。本项目以MEDLINE 生物医学文献为主要数据源,基于特征耦合泛化(FCG)、深度学习方法实现生物实体识别;基于生物医学领域知识的语义消歧实现名称标准化;利用基于深度学习的信息抽取进行医学概念共现识别;引入监督学习方法,选取包含潜在语义空间相似度、医学语义关联度和全局语料库统计量以及信息抽取的统计特征等多种特征来综合评定概念间的相关度量,最终获得生物医学文献中的隐含知识;在闭合式隐含知识发现方面,提出了逻辑主题路径的方法,通过文本主题间的逻辑关系进行文本的过滤,然后在逻辑相关的文本中对候选的治疗机制进行打分排名,进而对药物治疗关系做出合理的解释。基于以上技术,本项目已建立具有实用价值的生物医学文献隐含知识发现平台。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
2

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
3

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

DOI:10.19783/j.cnki.pspc.200521
发表时间:2021

相似国自然基金

1

基于开放知识网络的特定目标隐含线索发现研究

批准号:U1836206
批准年份:2018
负责人:王元卓
学科分类:F0210
资助金额:251.00
项目类别:联合基金项目
2

基于GIS的青藏高原科研文献知识发现研究

批准号:40701133
批准年份:2007
负责人:王雪梅
学科分类:D0114
资助金额:19.00
项目类别:青年科学基金项目
3

混合型生物医学知识网络构建及隐性知识发现方法研究

批准号:61702214
批准年份:2017
负责人:白天
学科分类:F0213
资助金额:23.00
项目类别:青年科学基金项目
4

面向社交网络的药物不良反应的隐含知识发现

批准号:61572102
批准年份:2015
负责人:林鸿飞
学科分类:F0211
资助金额:64.00
项目类别:面上项目