Bone Mineral Density (BMD) is the main indicator assess the effect of calcium intervention. Given its poor accuracy and sensitivity and expensive cost, BMD cannot be used to evaluate treatment effect and identify susceptive group in the early stage of intervention study. In this study, dynamic probabilistic principal components analysis (DPPCA) will be fitted to screen significant biomarkers, which were measured in each time point. Then metabolic pathways will be explored. The main study contents are following: constructing DPPCA and simulation experiment, estimating model parameters, estimating time effect and testing significant biomarkers, data visualization, identifying biomarkers and biological explanation and so on. In this study, DPPCA will be constructed to analyze longitudinal metabolomics data and approach estimating model parameters will be provided. DPPCA can assess the effect of time within each treatment group and identify metabolites which change over time within each treatment group. This study will provide effective and reliable information to identify susceptive biomarkers of calcium supplementation trials. Thus susceptive group will be screened as early as possible. Therefore, it is important to modify strategy of calcium supplementation, population health and disease prevention.
骨密度作为钙干预研究的主要指标在准确性、灵敏性、应用广泛性、放射性和价格费用较高等方面存在问题,这些问题中以灵敏性差最为突出,在干预研究中不能用于早期干预效果评价和敏感人群识别。本研究通过检测钙干预人群不同时点代谢产物,拟合动态概率主成分分析(DPPCA)模型筛选出有意义的敏感生物标志物,并进一步探索代谢途径。主要研究内容包括:动态概率主成分模型的构建和模拟运算、模型参数估计、时间效应估计及标志物显著性检验、数据可视化、标志物鉴定和生物学解释等几个方面。本研究预期构建适合多时点动态代谢组数据的动态概率主成分分析模型,给出模型参数估计方法和策略。该模型能够分别对每个处理组的代谢产物进行时间效应估计,筛选出干预组和对照组时间变化显著的代谢物。该研究可以为钙干预试验中敏感标志物的识别提供有效可靠的信息,进而可以对敏感人群进行筛查,对调整补钙策略、人群健康和疾病预防具有很大的实际意义。
目前关于代谢组学数据分析方法中,针对横断面的方法居多,如PCA、PLS-DA、OPLS-DA等是比较成熟且常用的方法。然而进行多时点纵向高维组学数据分析时,横断面的代谢组学数据分析方法不仅忽略纵向数据代谢物之间的相关性,而且不能分析代谢物的动态变化情况。现有的纵向代谢组学数据分析方法不仅对数据均衡性的要求高,且时间变异的解释也未具体到组间差异变量。因此,本研究基于分析多时点纵向高维组学数据角度,提出构建动态概率主成分分析模型,通过模型的参数估计、模拟实验及实际数据分析等不同方面探讨此模型在纵向高维组学数据分析中的应用,动态概率主成分分析将为纵向高维组学数据分析方法提出新的思路。.主要研究内容包括三个部分:DPPCA模型方法学研究部分(包括模型的构建、参数估计、算法实现、模型评价及模拟实验等)、绝经期妇女骨质疏松差异代谢物筛选研究、DPPCA模型的实际应用研究。.在方法学部分将随机波动模型与概率主成分分析模型结合构建动态概率主成分分析模型,利用马尔可夫链门特卡罗法实现模型中参数估计;通过模拟实验评价动态概率主成分分析模型在不同参数设置条件下变量筛选的能力。将该模型用于绝经期骨质疏松与非骨质疏松纵向代谢组学数据分析,探索数据的时间效应并结合线性混合模型筛选出随时间变化的组间差异代谢物。模拟实验结果显示,动态概率主成分分析模型变量筛选的灵敏度、特异度、预测准确性随着样本量、差异变量的相关系数和数据纵向相关系数的增大而增大;相同条件下变量筛选的灵敏度要高于特异度。将正常人组、骨流失组与骨质疏松症组三组进行两两比较,利用生物统计学方法筛选出正负离子模式下,PLS-DA模型中VIP>1.0且单变量Wilcoxon秩和检验P值<0.05的物质,共得到差异代谢物22个。实际应用研究中绝经期妇女代谢组学数据动态概率主成分分析表明,骨质疏松组与非骨质疏松组代谢轨迹具有不同的变化方向及变化幅度。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
一种光、电驱动的生物炭/硬脂酸复合相变材料的制备及其性能
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
基于代谢组学蛋白质组学多组学技术的锌缺乏生物标志物筛选和代谢通路分析研究
应用蛋白组学与代谢组学技术筛选盐敏感性标志物的研究
基于代谢组学白血病MDR标记物筛选及中药活性成分干预研究
基于血清多肽组学和代谢组学的肿瘤早期标志物的发现及诊断模型的构建