Standardization was the key issue which needed to be resolved urgently for sharing and use of health statistical big data. The focus of the issue was short of adaptive data presentation standards for statistical knowledge and variable (data element), good harmonization among existing data standards, and explicit metadata specification for the processing of statistical data. In this study, based on the complete analysis on characteristics about health big data resources in China, we applied Ontology and metadata theory and technology to construct statistical data presentation standards (health statistical ontology and data element standard) and statistical metadata specification for meeting demand of health statistical informatization development in China by using Protégé and Rose UML as modeling tools. We also constructed conceptual data model of health statistical big data in order to illustrate harmonization mechanism among existing data standards, such as existing health data set standards. The aim was to provide necessary information standard support for sharing statistical knowledge and data, improving usability of statistical data, enhancing the scientificity and interpretability of statistical results, and establishing firm base for use health statistical big data efficiently.
标准化是卫生统计大数据共享和利用亟待解决的问题,问题的关键在于统计知识和统计变量(数据元)的表达缺乏适宜的数据标准、已有的数据标准间缺乏良好地协同性、统计数据处理过程缺乏明晰的元数据规范。本研究在综合分析大数据环境下我国卫生统计数据资源特征的基础上,利用本体论和元数据理论与技术,以protégé 和Rose UML 为建模工具,建立能够满足我国卫生统计信息化发展需求的统计数据表达标准(卫生统计本体与数据元标准)和统计元数据规范,并通过建立卫生统计大数据概念模型,明确数据标准间(如数据集标准)的协同机制,以期为统计知识和统计数据的人-机共享、信息系统间的统计数据融合、跨业务域数据标准的协同以及统计数据处理的规范化提供必须的信息标准支撑,从而提高统计数据的可用性、增强统计结果的科学性和可解释性,为卫生统计大数据的有效利用奠定坚实的基础。
大数据是国家重要的战略资源。卫生统计大数据是大数据的重要组成部分,推动卫生统计大数据应用,充分发挥其在支持国家卫生方针政策制定、卫生管理质量提升中的重要作用是我国卫生统计工作的战略重点。然而,卫生统计大数据应用依然面临诸多困境,统计数据烟囱林立、碎片化、条块化的现象依然严重,给统计大数据整合利用带来困难。造成这些困难的主要原因是统计大数据的标准化程度低,缺乏支持多源异构大数据深度融合与共享的信息标准,如标准体系框架、概念模型、术语标准等。本研究在对现有的健康医疗大数据调查研究的基础上,分析了健康医疗大数据资源的现状和标准化程度,进一步明确了卫生统计大数据的标准化需求,围绕统计数据采集、分析处理及利用的全流程,以UML为建模工具,构建了卫生统计大数据概念模型,确定了概念模型的核心类、属性和类间关系,为跨域卫生统计数据协同共享提供了参照,为规范统计工作流程提供了重要的元数据标准,增强了统计数据的可理解性和可解释性,提升了统计数据的可用性;另一方面,由于缺乏支持人和机器都能理解的术语标准,使得统计大数据的深度挖掘面临重重困难。本研究以protégé为建模工具,开发了卫生统计本体,实现了卫生统计领域知识的人-机可读性和术语概念的规范化表达。卫生统计本体具有强大的语义表达能力和推理能力,能够为统计数据的整合、共享和深度挖掘提供重要的标准支撑,从而促进统计大数据的深度应用,更好地服务于卫生管理与决策。在标准协同与兼容性方面,本研究在构建卫生统计本体和卫生统计大数据概念模型过程中,保持术语语义、属性的值域等遵照国家和行业的上位标准,以保持标准之间的协调兼容性。
{{i.achievement_title}}
数据更新时间:2023-05-31
带有滑动摩擦摆支座的500 kV变压器地震响应
"多对多"模式下GEO卫星在轨加注任务规划
智能煤矿建设路线与工程实践
强震过程滑带超间隙水压力效应研究:大光包滑坡启动机制
铁路大跨度简支钢桁梁桥车-桥耦合振动研究
中医舌诊图像信息采集标准化关键技术研究
机载大孔径静态干涉光谱成像数据处理关键技术研究
大图数据管理与分析的基础理论与关键技术研究
基于热点导航的大图数据迭代计算过程可视化关键技术研究