Mixed multi-response longitudinal data arise commonly in modern rapidly developed scientific experiments. It is now fundamentally important and necessary to jointly analyze the associations between different types multi-response longitudinal variables and correlations between repeated measurements for each response variable. Compare to traditional univariate longitudinal response, statistical inferences are totally different and more complex for multi-response longitudinal variables. First, the error variances can be different for different response variables; Secondly, the errors for the same response variable measured at different time points are usually correlated; Thirdly, the errors of all responses may be correlated; Finally, the multi-responses are often mixture of different types of variable. Therefore, the statistical inferences for multi-response longitudinal data are more challenging. This project aims to propose joint mean-correlation modeling approaches and efficient computing software packages. Within marginal modeling and generalized mixed effect model frameworks, jointly modeling the regression mean and correlation structures can bring light to interpret the correlation between multi-responses and the association between multi-responses and covariates, improve the estimation precision and provide more effective conclusion.
现代科学试验技术的飞速发展使得混合多响应纵向数据越来越常见。联合分析多个不同类型响应变量之间的相关性以及它们和其他协变量之间的关系成为许多纵向研究的基本要求和主要目标。相比于传统的单响应纵向数据分析,多响应纵向变量之间相依关系错综复杂:首先每个响应变量的测量误差方差可能不同;其次,同一响应变量在不同时间的测量误差一般是相关的;然后,多个响应变量的测量误差之间也可能存在相关性;最后,多个响应变量常是不同类型变量的混合。 这些特点使得联合分析混合多响应纵向数据面临着很大的挑战性。本项目拟对混合多响应纵向数据提出均值和相关结构的同时建模和计算方法。在边际模型和广义线性混合效应模型框架下,对多响应纵向变量的相关结构提出有效建模的基础上,再结合回归均值进行同时推断。从而可以深刻理解多响应纵向变量与协变量之间的关系,提高均值推断的效率,得出更加全面有效的结论。
本项目利用边际模型、回归模型、Copula等统计模型工具,对混合多响应纵向数据构造有效统计推断方法,深入研究其理论优良性。项目在相依结构建模、结构学习与发现、高维场合下正则化方法的应用、复杂纵向数据下的有效联合建模等多个方面进行了理论和实证研究。项目发表已标注研究论文25篇,其中SCI论文20篇(如Biometrika1篇,JMVA论文4篇;Statistica Sinica 1篇;CIMS 2篇等),开发相关软件3个。主要研究成果包括:首先,我们解决了高维场合下精度矩阵和回归推断的若干问题。由于多响应纵向数据的特征,已有惩罚函数不再适用。我们构建了一类新的凸惩罚函数,给出了块带状精度阵的不同估计方法。模拟研究和理论研究表明所提方法具有较好的收敛速度、稀疏性和精确带状恢复率。对高维回归的变量选择和检验等推断问题,我们利用最近半正定投影和L1与非凸惩罚函数,解决了存在可加和乘积测量误差时的回归预测与变量选择问题,并证明了所提方法具有Oracle预测和误差界。同时,在一类损失函数下获得了回归模型假设检验方法的稳健性问题的理论性质。其次,解决了混合类型纵向数据的有效推断问题。针对纵向数据的测量尺度,我们使用边际广义线性混合模型和Copula模型,利用EM、MCMC等计算方法,基于频率方法和贝叶斯方法提出了回归均值-相依结构同时建模的多种有效推断方法,并获得了参数估计的大样本性质。第三,对一类基于U统计量的高维块状结构矩阵,我们创新性地提出了一种识别其块数目和发现结构的方法。所提出的方法简单易行,且具有优良统计性质。最后,开发了多个R软件包。用于离散纵向数据分析的均值-相依结构建模的R软件包jmdl目前下载量累计11000次以上。其他R软件已经在Github上提供。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
特斯拉涡轮机运行性能研究综述
纵向数据单指标混合效应模型的有效统计推断
复发事件的均值模型和纵向数据的分位数回归的统计与推断
偏正态纵向数据混合效应模型的统计推断及应用
复杂纵向数据的统计推断