In longitudinal data modeling in the fields of biomedicine and epidemiology, due to the complexity of the actual problems, we often encounter some complex data, such as measurement error, censoring, non-normal, biased and high-dimensional data. Common analysis method aims to model the conditional mean feature of the response variable under the assumption of normal distributions on random effects and error terms. However, this modeling method performs sensitive with outliers and extreme values and the estimated results are generally biased with large deviation. Except the average characteristics of the response variable, it can not capture other conditional distributional information. This project mainly plan to model the above complex longitudinal data by using modern quantile regression method. Specifically, we will utilize the parameteric mixed effect model or semeparametric mixed effect model to capture the characteristics of the data, and flexiblely use quantile check function method, joint hierarchical likelihood method and Bayesian modelling ideas for conducting statistical inference. At the same time, based on the considered modelling methods, we will analyze the medical AIDS data sets to present more complete biomedical information than the traditional mean regression. In addition, for addressing the need of high-dimensional medical big data analysis, we make good use of the epidemic penalty variable selection methods to find significant explanatory covariates and more frugal models for interested medical responses. These works may provide more references for actual medical workers.
在生物医学和流行病学等领域的纵向数据建模中,由于实际问题的复杂性,常常会碰到诸如,测量误差,删失,非正态,有偏以及高维等复杂数据情形.常见的分析方法是基于组内误差和组间随机效应项的正态分布假定来对响应变量的均值特征进行建模. 然而,这种建模方法对异常数据和极端数据表现敏感,所得估计往往带有较大偏差,也无法获知响应变量的其他条件分布信息.本项目主要运用现代分位回归方法来对上述复杂纵向数据进行建模,我们将基于参数混合效应模型及半参数混合效应模型来捕捉数据的特征,并灵活使用损失函数方法,联合分层似然方法以及Bayes方法等建模思想进行统计推断.并基于所研究的方法,来分析医学艾滋病数据集,以获得比传统均值回归方法更为精细的生物医学信息.同时,基于高维医学大数据分析的需要,结合目前流行的多种惩罚变量选择方法,筛选出对医学响应指标有显著影响的解释变量和更为节俭的分析模型,为实际医学工作者提供参考.
本项目针对生物医学统计等领域中经常出现的删失、测量误差、重尾、高维及非正态等复杂纵向数据,通过选择适当的纵向混合效应模型,灵活运用联合分层似然,贝叶斯联合估计以及损失函数等方法,研究了模型的分位回归、复合分位回归及变量选择问题,并借助于Matlab和R等统计软件开展模拟和实证研究,并将研究结果应用到艾滋病临床数据集的建模和分析中。本项目研究结果主要有:1、运用分位损失函数方法、联合分层似然方法及贝叶斯联合建模方法研究了带删失和测量误差数据的纵向混合模型的分位回归估计问题及其艾滋病数据分析中的应用;2、研究了纵向混合模型的贝叶斯复合分位回归及带删失数据的混合效应模型的变量选择问题及应用;3、研究了误差自回归线性模型和自回归滞后变量模型的的分位回归及贝叶斯变量选择问题;4、研究了带删失、重尾和高维特征等复杂数据下其他复杂模型的统计分析及应用。以上研究成果可部分应用于医学数据分析、可靠性数据分析和数量经济分析等相关领域。本项目研究共发表SCI论文9篇,中文核心期刊5篇。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
粗颗粒土的静止土压力系数非线性分析与计算方法
基于贝叶斯分位回归的面板数据建模、算法及应用研究
金融时序数据的动态分位数回归建模及其应用
基于当代分位回归与鞍点逼近方法的复杂数据分析
基于纵向数据的秩回归和分位数回归的有效参数估计