Up to now, nearly half of patients with Type 2 Diabetes Mellitus (T2DM) cannot be diagnosed at early stage in domestic and overseas, and Diabetes Retinopathy (DR) caused by T2DM is the principal factor leading to irreversible blindness, while studies on big data risk assessment and prediction models for outcome of DR based on general population are rare. Based on our previous experiences in statistical inference using big data (such as studies on association between glycomics and glycometabolism, disease prediction with medical images), as well as the latest advance in this field, we assume that time-dependent competing risk and Gaussian process models are advanced and suitable methods to solve the problem with big data. In the study, T2DM risk assessment will be conducted using time-dependent competing risk model based on physical examination and behavior data of healthy people both at baseline and through yearly follow up (we had collected from a cohort of 240,000 medical examination population). Furthermore, in the T2DM monitoring population pre-established with 160,000 community residents, new patients diagnosed by oral glucose tolerance screening test and patients previously diagnosed will be followed up. Big data with multidimensional texture characteristics extracted from fundus images and N-glycosylation biomarkers of, and previously diagnosed patients and control population will be analyzed to build DR prediction models using Gaussian processes and other data mining methods. The study will provide scientific evidence for risk assessment, early intervention and comprehensive prevention for DR patients caused by T2DM, and supply methodological reference for statistical predication using big data.
我国半数以上2型糖尿病(T2DM)患者不能早期发现,视网膜病变(DR)是T2DM主要并发症和不可逆性盲的首要因素,但目前缺少基于自然人群以DR为终点事件的大数据风险评估与预测模型。本研究在课题组前期糖代谢、糖基组学和医学图像预测疾病研究工作基础上,采用适合大样本、高维、非结构、混杂大数据的依时竞争风险和高斯过程模型,分析24万健康体检人群资料,包括基线及逐年随访的体检和行为因素数据,研究依时竞争风险模型建立成年人群T2DM风险评估工具;在前期建立的16万社区居民T2DM监测现场,对未确诊者进行筛查,对新发和既往T2DM患者进行随访;收集新发及既往DR患者与对照人群的眼底图像和生物标本,整合N-糖基生物标志物和眼底图像高维纹理等构成的大数据,研究高斯过程模型等方法构建T2DM发生DR的预测模型,为T2DM导致DR的风险评估、早期发现和预测预警提供科学依据,为疾病大数据分析提供方法学支撑。
糖尿病性视网膜病变(DR)是多发且严重的微血管并发症,是不可逆性盲的首要原因。由于缺少基于纵向大数据队列构建的成年人群2型糖尿病(T2DM)早期筛查工具,2/3患者不能在初患病时及时发现,确诊时1/3患者已经出现了DR。需要构建大数据模型,对T2DM导致DR进行风险评估与预测方法学研究。.一、主要研究内容和重要研究结果.1.构建T2DM发病的多类别、多时段的风险评估模型.采用竞争风险模型建立了T2DM发病7年简易指标和精确指标的早期筛查风险评估工具,且经过国内外13个风险评估模型验证,本项目的这两个模型最优;采用依时竞争风险模型,建立了简易与精确两个成年人群10年的T2DM风险评估工具,在测试集中 C指数分别为0.66、0.77;采用依时竞争风险模型,建立了中老年人群20年的T2DM风险评估量工具,模型C指数为0.76。.2.研究数据挖掘方法和深度学习方法,构建了眼底图像的诊断模型.采用Contourlet变换对眼底图像进行分解,然后采用灰度共生矩阵算法提取纹理特征,每个眼底图像共获得1344个纹理特征。弹性网降维效果优于LASSO和高斯过程,具有较好的降维效果:灵敏度0.943,特异度0.982。提取眼底图像的36个质量特征,发现XGBoost模型(优于高斯过程模型)的眼底图像质量分类中,准确性为100%,AUC为96.9%。.3. 筛选糖尿病性视网膜病变的相关糖基标志物.在筛选了T2DM相关12个IgG糖基标志物基础上,发现了T2DM 导致DR的4个IgG糖基生物标志物:GP15、 GP20、IGP54、IGP32。IgG糖基评分十折交叉验证的结果为0.744提升至0.923,且这4个标志物可独立于临床指标,成为DR潜在的新分子标志物与干预靶点。.二、取得的主要成果.项目组共发表标注项目号且密切相关的学术论文52篇,其中SCI论文39篇,中文核心期刊论文13篇;培养博士生2名(刘相佟,王安心)、硕士生3名(田思佳,孙扬,王绍华)获得学位; 本项目团队有4名青年教师晋升职称;5人次青年教师获批大数据建模方法的国自然基金7项。申请国际发明专利2项、申请国内专利1项。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
粗颗粒土的静止土压力系数非线性分析与计算方法
基于LASSO-SVMR模型城市生活需水量的预测
基于肺结节多正交位CT图像Curvelet纹理构建 Gradient Boosting 集成预测模型
基于农村社区队列人群的中国成人2型糖尿病风险预测与评估
火灾风险评估方法学
2型糖尿病患者糖化白蛋白水平与糖尿病视网膜病变发生风险的关联性研究及机制探讨
基于机器学习的早产儿视网膜病变风险预测和自动诊断模型研究