In clinical practice, the prognosis prediction model has become increasingly appreciated. In recent years, the method of constructing prognosis prediction model has changed from expert experience mode to data-driven mode, especially establishing prediction model based on the electronic health records has become a hot area of research. However, due to the significant differences in system architecture, data management pattern, clinical term coding system and data sharing strategies, it is difficult to translate massive clinical data from multi-center electronic health record systems into clinical decision support system which may help doctors and patients in clinical practice. These problems have seriously restricted the analysis of medical big data from “single-center” to “multi-center”. This study intent to break through the existing research paradigm of “first data aggregation then data analysis”, and focused on the unified expression of clinical data from multi-center electronic health record system and the construction and evaluation methods of multi-center fusion prognosis prediction model. This study explored novel solutions for collaborative analysis of multi-center electronic health record data which currently was difficult to carry out effectively due to the problems such as clinical data normalization, patient data privacy-preserving and data heterogeneity feature aggregation. Finally, through the establishment of a prototype system, the theory and technology proposed in this study were validated and evaluated.
预后预测模型在临床实践中的作用日益突出,近年来预后预测模型的构建方法开始从专家经验模式向数据驱动模式转变,特别是基于电子病历数据构建预后预测模型已经成为领域研究的热点。然而不同医疗机构电子病历系统在软件基础架构、数据管理模式、临床术语编码、数据共享策略等方面存在巨大差异,难以将多中心电子病历中的海量数据转化为具有临床应用价值的决策支持模型及工具,从而严重制约医疗大数据分析从“单中心”走向“多中心”。本研究拟突破现有“先数据汇总,再建模分析”的研究范式,从多中心电子病历数据统一化表达、多中心融合预后预测模型构建与评估方法等方面开展研究,重点解决多中心电子病历数据协同分析中的规范化表达、患者数据隐私保护、数据异质性特征融合等关键问题,并通过建立原型系统,对本研究提出的理论与技术进行验证评估。本研究可为建立部署更灵活、覆盖范围更广、预测更精准的临床决策支持系统探索新理论、新方法。
预后预测在临床研究及实践中具有重要作用,近年来电子病历系统的应用及普及,为预后预测模型研究提供了丰富的数据来源。然而,单一医疗机构电子病历系统中积累的临床数据,由于样本数量、患者特征复杂度等方面的限制,往往难以满足数据驱动预后预测研究需求,因此构建高质量的数据驱动预后预测模型需要整合、分析来自不同医疗机构的多中心电子病历数据。建立一套面向多中心临床数据产生、存储、管理真实环境,兼具较高灵活性与可拓展性,并能够适应不同医疗机构患者数据隐私保护要求与数据异质性特点的数据协同分析预后预测系统具有十分重要的意义。. 本课题着眼于构建基于多中心电子病历数据协同分析的预后预测系统框架。首先搭建了构建了适应多家医院异构信息系统的多中心电子病历数据协同分析框架,完成了多家医院近20年的结直肠癌患者临床数据到OMOP通用数据模型的转换;其次构建了多中心融合预后预测模型及分布式隐私保护计算框架,包括基于多变量Meta分析的多中心协同预后预测框架、基于随机森林模型的多中心协同预后预测模型、基于同态加密的多中心隐私保护的预后预测模型以及基于半监督迁移学习的多中心协同分析预后预测模型;然后提出了多中心协同分析框架中预后预测模型评估方法,将针对预测模型在单一数据集上的预测性能评估指标拓展到了具有异质性特征的不同医疗机构数据集上;最后将提出的理论及框架针对结直肠肿瘤预后研究特点进行调整,构建了一套覆盖3家医疗机构电子病历系统(科室层级)的结直肠癌预后预测原型系统。本课题解决了多中心数据统一化表达、分析过程中患者数据隐私保护、不同医疗机构异质性数据融合等阻碍医疗大数据分析从单中心模式向多中心模式拓展的关键问题,可为建立部署更加灵活、覆盖范围更广、预测更加精准的临床决策支持系统探索新理论、新方法。. 在本基金的资助下,项目组在IEEE Journal of Biomedical and Health Informatics、Journal of Medical Internet Research等医学信息学领域权威期刊上发表期刊论文16篇,申请国家发明专利4项,授权国家发明专利9项,培养硕士研究生2名,协助培养博士研究生5名、硕士研究生11名。此外,项目负责人2020年获浙江省科技进步一等奖1项(排名7/13)。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于LASSO-SVMR模型城市生活需水量的预测
基于电子病历分析的慢病趋势预测方法研究
基于电子病历数据的多粒度个性化静脉血栓风险评估模型的构建
基于电子病历数据挖掘的急性冠脉综合征风险评估及干预效果分析方法研究
基于多色集合理论的医院间电子病历访问模型研究