面向临床辅助理解的电子病历可读化研究

基本信息
批准号:61802350
项目类别:青年科学基金项目
资助金额:25.00
负责人:程铭
学科分类:
依托单位:郑州大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:李霏,熊蜀峰,杨扬,孙保峰,李赐恩
关键词:
电子病历医学实体识别医学实体链接医学信息抽取
结项摘要

The readability of Electronic Medical Records (EMR) aims to make computers automatically analyze and extract important medical entities (jargons), and explain the meanings of the normalized medical entities. It is able to help patients to comprehend their EMR notes and is important expansion of information extraction in the medical domain. Current patient-oriented researches on readability of EMR involve medical entity recognition and entity linking (normalization). Prior medical entity recognition work only considers the continuous entities, while there are a large number of discontinuous entities in EMR. We aim to build a large-scale annotation resource of EMR. Based on the resource, we study medical entity recognition (MER) models based on parallel recurrent neural network to identify the entities quickly. It can express continuous and discontinuous medical entities in a unified framework, and employ neural networks to automatically extract features. In addition, the importance of different medical entities to the patients are different. Therefore, we plan to analyze the importance of the entities from multiple perspectives, and adopt a fusion strategy to integrate the heterogeneous analysis results, which may boost the recognition performance of models. We map the more important medical entities to the Wikipedia. It explains the meanings of the normalized medical entities. This research is beneficial for the related research work of medical information extraction, integration and application in EMRs.

电子病历可读化旨在让计算机自动分析抽取病历中重要的医学实体(术语),并对其进行规范化和解释,辅助患者理解病历内容,它是信息抽取研究在医疗领域的重要扩展。目前面向患者的病历可读化研究主要包括医学实体识别和实体链接(规范化)技术。以往的医学实体识别工作仅考虑连续实体,而病历中存在大量的非连续实体。基于此,我们拟构建一个大规模电子病历标注资源,并在此基础上研究基于并行循环神经网络的医学实体(术语)快速识别模型。该模型在统一框架下表示连续和非连续医学实体,并利用神经网络来自动抽取特征。另外,由于不同医学实体对患者的重要程度不同,因此本项目拟从多角度分析实体重要性,采用融合策略整合异构分析结果,进而帮助提升模型对重要实体的识别效果。最后,将识别出来的重要医学实体链接至维基百科规范其表示并解释含义。本项目的研究对电子病历医学信息抽取整合及应用的相关研究工作有重要意义。

项目摘要

随着医疗信息化进程的不断加深,智慧医疗技术已经成为新的研究热点。本课题针对临床病历中医学实体抽取、医学实体链接以及面向电子病历的临床应用等问题进行了深入研究。课题的主要研究内容包括:1)面向电子病历的临床医学实体识别方法研究,提出一种基于多任务学习融合外部知识的临床实体识别方法,在两个公开数据集上平均达到91.70%的性能,在私有数据集达到87.05%的性能,显著优于其他方法;提出一种基于混合神经网络的关键临床信息抽取方法,对重要临床信息进行自动抽取,实验结果表明该方法在临床信息抽取任务中是有效的。2)面向临床电子病历的医学实体链接方法研究,设计了一种基于多任务学习的医学实体链接方法,构建多任务学习框架,将医学实体链接作为主任务,引入医学实体分类作为辅助任务,辅助任务可以缓解信息不充足的问题,促使模型学习更多的底层表达,从而有效的提高模型的性能及泛化能力。3)面向电子病历的临床应用研究,提出一种面向电子病历的混合注意力机制模型为脑卒中患者的康复治疗方案进行推荐,采用自注意力和康复项目注意力构建面向特定康复项目的病历表示,在真实临床数据集上进行实验,实验结果证明了该方法具有更好的推荐性能;提出了一种面向电子病历的血培养检测模型,快速预测血培养检测结果,缓解血培养检测周期长,不能满足临床快速精确诊断要求的问题,实验结果表明该方法在实际临床应用中是有效的。综上所述,课题不仅构建了大规模的中文医学实体语料库,还针对相关任务提出相应的解决方法且取得了良好的性能,为智慧医疗技术的研究具有推动作用。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
3

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

DOI:10.19783/j.cnki.pspc.200521
发表时间:2021

程铭的其他基金

相似国自然基金

1

面向临床决策辅助的电子病历文本结构化方法与知识挖掘研究

批准号:61702033
批准年份:2017
负责人:尚小溥
学科分类:F0214
资助金额:25.00
项目类别:青年科学基金项目
2

面向电子病历的可修订数字签名研究

批准号:61872089
批准年份:2018
负责人:伍玮
学科分类:F0213
资助金额:62.00
项目类别:面上项目
3

面向不完备电子病历的属性协同演化约简机理与模型研究

批准号:61300167
批准年份:2013
负责人:丁卫平
学科分类:F0214
资助金额:24.00
项目类别:青年科学基金项目
4

面向糖尿病电子病历大数据的可解释性时序信息挖掘研究

批准号:61802149
批准年份:2018
负责人:吴利娟
学科分类:F0213
资助金额:21.00
项目类别:青年科学基金项目