Massive Electronic Medical Record (EMR) text may hide abundant unknown clinical knowledge. Although current Natural Language Processing (NLP) technique can divide the Chinese EMR text into structured words, it is still hard to attain satisfactory accuracy in terms of clinical research and decision-making support, which is the biggest barrier to realize computer-aided EMR text analysis. This project focuses on how to find out clinical knowledge from EMR text, and the usage of these knowledge to support clinical decision making and management. In this project, drawing on the NLP technique, we will integrate machine learning, hyper networks, and related theories to explore the technique of self-constructing dictionary, as well as the automatic structuring method for EMR text at the semantic level. Furthermore, we investigate how to use the mined clinical knowledge to support medical decision making through automatic clinical pathway modeling. The outcomes and methodology of this research will provide an interdisciplinary research agenda for clinical medicine through the lens of information technologies, which possesses important scientific significance.
海量电子病历文本数据中隐藏着诸多可能未知的临床知识。现有的自然语言处理技术虽然一定程度上能够实现将中文电子病历文本结构化分解,但其精确程度还无法满足面向临床实践的医学知识挖掘和决策辅助支持,这成为使用计算机分析非结构化的电子病历文本数据最大的障碍。本项目研究如何从这些电子病历文本中挖掘出临床知识,并将这些知识用于临床决策支持与管理。研究中将在当前自然语言处理技术基础上,引入机器学习、超网络等技术与理论,探索具有自学习能力的专业术语词典构建技术,以及语义层面的电子病历文本结构化分解技术,从中挖掘隐藏的临床知识,并基于这些知识实现以临床路径自动建模为核心的临床决策辅助支持。本项目的研究成果与研究思路,将能够为临床医学的相关研究提供信息技术视角的跨学科解决方案与思路,具有重要的科学意义。
电子病历是临床治疗活动中客观记录治疗全过程的重要数据资源,其中包括文本数据在内的不同数据类型数据的数据量极大,难以直接采用常规的数据挖掘分析方法进行处理与深度挖掘。医生或研究人员在研究过程中对电子病历的使用通常采用手工抽取相关信息的方式,效率较低且难以开展大规模的研究工作。在此背景下,以提高电子病历数据的可用性为目标,本项目研究相关理论与算法技术,实现电子病历的结构化,并进一步开展相关信息的挖掘与知识抽取研究,提升电子病历数据对临床治疗与临床管理决策的价值。项目采用合作医院提供的经过脱敏和去隐私处理的真实电子病历数据,在研究中重点针对电子病历数据的清洗加工、电子病历文本的结构化问题、电子病历的时间序列结构化问题、面向临床路径决策的电子病历治疗模式挖掘问题、数据驱动的医院运营优化问题、多属性决策的方法等问题展开了研究。基于上述研究内容,项目提出了相关的算法模型,分别从数据层面、可视化层面、以及辅助决策层面取得了相应的研究结果。这些研究成果有助于实现对电子病历相关数据内容的深度分析与挖掘,为临床医生、临床管理人员以及研究人员提供决策相关的信息与知识。相比传统的电子病历在上述场景下的使用方式,本项目的相关研究工作一方面能够提升临床决策效率,另一方面有助于挖掘不易察觉的重要临床决策线索和信息。
{{i.achievement_title}}
数据更新时间:2023-05-31
儿童多发性大动脉炎10例临床分析
口腔扁平苔藓研究热点前沿的可视化分析
临床应用中的新型冠状病毒肺炎治疗药物研究进展
区块链技术:从数据智能到知识自动化
部分短视和参考价格效应下的政企回收WEEE协同策略
面向临床辅助理解的电子病历可读化研究
面向非结构化文本的领域知识获取方法的研究
面向特定领域文本的知识元及其关联挖掘方法研究
基于深度学习和迁移学习的非结构化临床文本挖掘的方法探索