Longitudinal data are collected when data are observed repeatedly over a time interval from subjects,and are very common in biological research and environmental science. There could exist underlying correlations among the data from the same subject. How to model the correlations and improve parameter estimation is hot and difficult in the analysis of longitudinal data. The generalized estimating equations (GEE) method is commonly used to analyze the longitudinal data. This method incorporates the correlations, but is very sensitive to outliers.The methods based on rank regressions and quantile regressions are robust, but most of their estimating equations are constructed based on the independence working model assumption. Moreover, the computation for estimating the parameters and their covariance matrix is very heavy. In this project, we will consider the robust rank regressions and quantile regressions with longitudinal data. Under an assumption that the correlation structure of the data is known, we will calculate the covariance matrix of the estimating functions based on the ranks of response variables (in rank regressions) and of the estimating functions based on indicator functions of response variables (in quantile regressions), and then construct estimating equations by the idea of the GEE method. We will use the induced smoothing method to estimate the parameters and their covariance matrix, and therefore the computational burden can be reduced. Finally, we will evaluate the robustness and efficiency of the proposed parameter estimates by a number of simulation studies and the analysis of the real datasets.
纵向数据是指随着时间的演变追踪测得的数据。这种数据在生物研究和环境科学等领域广泛存在。在纵向数据中,由于来自同一个个体的数据间存在着潜在相关性,如何对这种相关性建模,进而提高参数估计的效是该领域研究的热点和难点问题。广义估计方程(GEE)方法是分析纵向数据常用的方法,它结合了数据的相关性,但对异常值极其敏感;基于秩回归和分位数回归的方法比较稳健,但多基于独立的模型假设构造估计方程,且估计参数及其协方差矩阵时计算量比较大。在本项目中,基于纵向数据,我们考虑稳健的秩回归和分位数回归,在数据的相关形式已知的情况下,计算反应变量的基于秩的估计函数(秩回归)和基于反应变量的示性函数(分位数回归)的协方差矩阵;利用GEE方法的想法构造估计方程;在估计参数及其协方差矩阵时,利用induced smoothing方法以降低计算量。最后,通过大量的模拟和实际数据分析评估本项目给出的参数估计的稳健性和高效性。
纵向数据生物研究、环境科学、心理学等领域广泛存在。在纵向数据中,由于来自同一个个体的数据间存在着潜在相关性,如何对这种相关性建模,进而提高参数估计的效是该领域研究的热点和难点问题。广义估计方程(GEE)方法是分析纵向数据常用的方法,它结合了数据的相关性,但对异常值极其敏感;基于秩回归和分位数回归的方法比较稳健,但多基于独立的模型假设构造估计方程,且估计参数及其协方差矩阵时计算量比较大。在本项目中,基于纵向数据,我们考虑稳健的秩回归和分位数回归,首先提出用高斯copula函数来刻画分位数回归的相关性,基于不同协方差矩阵,利用GEE方法的想法构造不同的估计函数,然后利用经验似然方法构对构造的估计函数进行组合,通过induced smoothing方法解估计方程中遇到的计算问题,并同时得到参数估计的协方差矩阵估计,降低计算量。当工作矩阵中包含真实的相关结构时,经验似然方法得到的参数估计可以达到最优。其次,本项目又利用模型选择的思想,基于伪高斯似然同时构造目标函数、AIC、和BIC准则。通过AIC和BIC准则选择最优的相关矩阵,从而选择最有效的参数估计。大量的模拟和实际数据分析表明,本项目提出的方法是高效的,且计算简单,对实际数据拟合的非常好。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
基于LASSO-SVMR模型城市生活需水量的预测
氯盐环境下钢筋混凝土梁的黏结试验研究
面向云工作流安全的任务调度方法
基于复合分位数回归和最大秩相关想法的ROC回归曲线估计
高维纵向数据分位数回归中的统计推断研究
纵向数据分位数回归模型的若干变点问题研究
复发事件的均值模型和纵向数据的分位数回归的统计与推断