It is an important research topic to make full use of the current big data for population health evaluation, which will contribute a lot to developing health management policies and achieving a well-off society. However, the existing health data are of wide sources, various structures, and uneven quality. Using these data directly for population health assessment will lead to some certain bias, thus unable to provide a reliable basis for health management decision-making. Therefore, it is of great practical significance to effectively integrate and smooth health big data, and properly deal well with missing, unstandardized and biased data, so as to conduct a comprehensive evaluation on population health using the data after smoothing. .In this program, we will first drastically collect and integrate the cause-specific mortality and morbidity data in Chinese population from various sources such as public health departments, medical institutions, and literature databases. Then, statistical methods of Meta regression, Gauss process regression (GPR) and model life table are explored and applied to integrate and smooth these extracted mortality and morbidity data. Moreover, based on the smoothed data, we are able to calculate and obtain the population health assessment indexes, such as disability adjusted life years (DALY) and health life expectancy (HALE). Finally, visualization tools can be further developed to clearly exhibit the health status of Chinese population for different genders and ages by regions and periods. Real time query of these health assessment results will thus provide more reliable data-based decision-making support for public health management.
充分利用现有健康大数据进行人群健康评价是健康管理决策、实现全民小康的重要研究课题。然而现有健康数据来源广泛且数据结构各异、数据质量参差不齐,单独使用这些数据进行人群健康评价会存在一定的偏倚,无法为健康管理决策提供可靠依据。因此,有效地对健康大数据进行整合、修匀,解决数据缺失、不规范、有偏等问题,并利用修匀后的数据进行全面的人群健康评价,具有重要的现实意义。本研究拟从公共卫生部门、医疗机构以及文献数据库中挖掘中国人群不同疾病的死亡率、患病率与发病率等数据信息,利用经过清洗后的数据,探索Meta回归、高斯过程回归(GPR)以及模型寿命表等统计学方法,通过这些方法进行数据整合、修匀,并在上述数据基础上计算伤残调整寿命年(DALY)和健康期望寿命(HALE)等人群健康评价指标,并开发可视化工具使不同地域、不同性别、不同时间的人群健康状况得以展示以及实时查询,为科学的健康管理决策提供可靠的数据支持。
在大数据时代,如何利用稀疏、噪声大数据进行人群健康评价,是当前面临的重要课题。本团队在如下几方面进行了研究:(1)基于全球疾病负担研究数据库,利用Joinpoint模型和年龄-时期-队列(APC)模型对29种癌症、中风、缺血性心脏病、慢阻肺的长期趋势进行了分析,发现1992年至2017年期间,主要癌症导致的死亡率和发病率风险普遍增加,而中风、缺血性心脏病和COPD死亡风险的时期和队列效应都随年份而下降,相关成果发表了20余篇研究论文。(2)使用分布滞后非线性模型、广义加性模型等模型度量了空气污染和非最佳温度对人群健康的影响,研究发现高温会增加短期死亡率,突然的温度变化会显著增加短期死亡率,男性和青少年对高温更敏感,而女性和老年人对低温更敏感,一系列研究结果发表在EI和EP等杂志上。(3)基于美国营养数据库等公开数据库,对糖尿病死亡风险进行了探究,研究发现糖尿病死亡率存在性别差异,女性患冠心病和全因死亡的风险更高,睡眠时间和身体活动不足都会增加糖尿病死亡风险,相关成果发表在Diabetologia等杂志上。(4)将APC模型、Lee-Carter模型、Cairns-Blake-Dowd模型、RH模型等模型应用于健康大数据修匀,并对乳腺癌疾病负担展开探究,研究发现饮酒、高体重指数(BMI)、高空腹血糖和吸烟是潜在的乳腺癌风险因素,相关成果发表在JAR等杂志上。(5)对疫情暴发初期武汉市COVID-19危重症患者分布及相关影响因素展开深入分析,发现高龄、男性和慢性病史与COVID-19危重症和死亡有关,研究结果发表在IJE杂志上。另外,使用SEIR模型估计COVID-19的实时再生数,Lasso回归与分位数回归度量防控措施的优先程度,为疫情防控工作提供指导。该课题共发表84篇中英文文章,其中10分以上影响因子论文3篇,该基金号第一标注60篇。此外,还将全球疾病负担研究的核心方法“描述流行病学Meta回归框架”在国内进行了推广。本研究极大的拓展了大数据方法在公共卫生领域的应用,获得了稳健、可信的人群健康评价结果,为相关部门政策制定及卫生资源配置提供了更为科学的决策参考。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
硬件木马:关键问题研究进展及新动向
基于LASSO-SVMR模型城市生活需水量的预测
内点最大化与冗余点控制的小型无人机遥感图像配准
健康测量的概念框架与健康数据评价方法研究
劳动力人群健康促进与健康管理干预效果的效用测量与多维度评价方法研究
基于风险评价识别我国空气污染健康损伤的高危人群
基于体质特征的亚健康状态人群基础证候评价体系研究