Data-driven medical research is a hot topic currently. In the case of Chronic disease prevention and management, most studies focus on chronic disease risk prediction rather than progression and evolution trend using structured table data. They project try to explore the theories and methods of data-driven chronic disease trend prediction, which is of great theoretical and practical significance. The project contains the following three contents at different levels: 1) Clinical information extraction (from data to information) – how to convert heterogeneous clinical data (clinical texts and tables) into clinical information (i.e., clinical entities with attributes) and normalize them; 2) Patient status representation based on clinical information (from information to patient status) – how to use the extracted clinical entities to represent patient status; 3) chronic disease trend prediction based on patient status sequences (from patient status to chronic disease trend prediction) – How to predict chronic disease trend using patient status sequence where time interval is irregular.
数据驱动的医学研究是当前的热点之一。在慢病防治和管理方面,大部分研究停留在利用结构化表格数据预测慢病发生的风险,缺少对慢病发展和演变趋势预测的研究。项目试图通过分析电子病历中非结构化文本和结构化表格组成的异构数据,预测慢病的发生、发展和演变趋势,形成一套完整的理论与方法。项目主要包括三个不同层次的研究内容:1)临床医疗信息抽取(数据到信息)-如何从异构临床医疗数据(临床医疗文本和表格)中抽取临床医疗信息(即临床医疗实体及属性),并加以标准化;2)基于临床医疗信息的患者状态表示(信息到患者状态)-如何将利用抽取得到的临床医疗实体来表示患者的状态;3)基于患者状态表示序列的慢病趋势预测(患者状态到慢病趋势)-如何利用时间间隔不等的患者表示序列对慢病趋势进行建模。
项目选取疾病风险评估这一热点问题,试图探索以数据为驱动的疾病风险评估的理论和方法。其主要任务是,根据按时间顺序排列的电子病历动态评估患者患一种或多种疾病的风险。包括以下不用层次的三个方面的研究内容:1)临床医疗信息抽取(数据到信息);2)基于临床医疗信息的患者状态表示(信息到患者状态);3)基于患者状态表示序列的疾病风险动态评估(患者状态到患病风险)。四年以来,项目组根据项目计划书,全面开展了相关研究工作。1)在临床医疗信息抽取方面,研究了细粒度医疗实体及属性表示方法,并分别提出了基于串行联合学习的医疗实体及属性抽取方法和基于阅读理解的实体标准化方法。在医疗实体及属性抽取任务上,基于串行联合学习的方法因能有效避免医疗实体/属性识别和医疗实体/属性关系抽取任务之间的错误传递,明显优于传统的基于管道式的抽取方法。提出了基于阅读理解的临床医疗实体标准化方法,取得了优于传统基于文本匹配的临床医疗实体标准化方法的效果。2)在病人队列筛选方面,分别提出了基于层次神经网络的病人队列选择方法和基于阅读理解的队列选择方法。两种方法均取得了较好效果,前者在N2C2 2018国际公开评测上取得了所有系统中排名第二,基于机器学习系统中排名第一的成绩;后者在N2C2 2018数据集上了取得了目前最好性能。3)在基于临床信息的患者状态表示方面,分别提出了多道融合的表示方法、任务自适应的注意力表示方法。4)在基于患者状态表示序列的慢病趋势预测方面,基于3),分别提出了时序图与LSTM融合的疾病趋势预测方法、基于多道融合的LSTM疾病趋势及诊疗预测方法和基于任务自适应和时间敏感的疾病趋势及诊疗预测方法。这些方法就能有效捕获不规则时序和临床医疗实体之间的关联关系。已顺利完成论文发表、学生培养目标和原型系统的开发,一些系统并在部分医院进行试用。项目的研究成果对医疗人工智能的发展具有一定的推动作用。
{{i.achievement_title}}
数据更新时间:2023-05-31
硬件木马:关键问题研究进展及新动向
基于LASSO-SVMR模型城市生活需水量的预测
伴有轻度认知障碍的帕金森病~(18)F-FDG PET的统计参数图分析
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
针灸治疗胃食管反流病的研究进展
基于多中心电子病历数据协同分析的预后预测系统
基于电子病历数据挖掘的急性冠脉综合征风险评估及干预效果分析方法研究
社交网络用户行为分析及话题演化趋势预测方法研究
基于延拓核主成分分析的空间滚动轴承性能演变趋势预测方法研究