Modeling longitudinal data subject to missingness has been an active area of research, however, since the missing mechanism is too complex, the related research is not enough. Robustness is one of the most important aspects in statistical modeling process, especially when data contains outlier, robust estimation and variable selection methods should can resist the effects of outlier and perform stably. The purpose of this research is to propose a series of robust estimation and variable selection methods for incomplete longitudinal data by combining the correlation structure and the missing mechanism. The main works of this project are as follows: (1) We consider the robust estimations of the unknown parametric components and nonparametric components of the models; (2) The robust empirical log-likelihood ratios are proposed and are proven to be asymptotically chi-squared, then the corresponding confidence regions and pointwise confidence intervals are constructed. (3) We consider the robust variable selection and prove the resulting estimator possesses the consistency in variable selection and the Oracle property in estimation under some regularity conditions. These results will provide scientific analysis methods and effective statistical inference tools for incomplete longitudinal data in biomedicine and related fields.
纵向缺失数据的建模问题一直是一个活跃的研究领域,但由于缺失机制过于复杂,至今相关的研究还不够深入。稳健性是统计建模分析中非常重要的一方面,尤其是数据中存在异常值时,估计或变量选择的结果不至于受到很大影响而变得不稳定。本项目的研究目的是针对纵向缺失数据,结合纵向数据组内相关性和缺失机制的类型,提出一系列稳健的估计和变量选择方法。主要研究内容包括:(1)考虑模型中参数分量和非参数分量的稳健估计问题;(2)构造模型中参数分量和非参数分量的稳健的经验对数似然比,证明他们渐近服从卡方分布,并构造兴趣参数的置信域和逐点置信区间;(3)考虑稳健的变量选择问题, 并在一定的正则条件下,证明变量选择的相合性和估计的 Oracle 性质。这些研究将为生物医学及相关领域的纵向缺失数据分析提供科学的分析方法和有效的统计推断工具。
本项目主要致力于半参数模型下纵向缺失数据的统计方法和理论研究。在研期间取得了以下研究成果:(1) 通过发展现有的参数和非参数估计方法,研究了纵向数据下部分线性测量误差模型,构造了模型中参数分量和非参数分量的经验似然比统计量,证明经验似然比统计量是渐近卡方分布,并给出了置信域;(2) 对缺失数据下部分非线性模型,考虑了非参数分量的拟合优度检验问题,给出了两个新的检验统计量,从理论上证明所给新检验统计量在原假设成立时和局部备择假设成立时的渐近分布,同时基于局部平滑的检验方法,所提方法能以最优速度区分不同于原假设的局部备择假设;(3) 研究了协变量随机缺失下单指标变系数模型的估计问题,利用逆概率加权方法构造出指标参数向量的加权估计方程,以及由局部估计方程方法得到了系数函数向量的加权局部估计方程,并对上述加权估计方程所导出的估计量的渐近性质进行了研究;(4) 通过模拟研究和实际数据分析验证所提方法的可行性。.本项目的研究成果将为纵向数据、缺失数据等复杂数据提供科学的统计分析方法,从而为生物学、医学、环境科学、计量经济学、生命和社会学等领域的研究提供可行的理论和方法,同时也会丰富半参数模型的研究成果。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响
针灸治疗胃食管反流病的研究进展
缺失数据下半参数度量误差回归模型的统计推断
纵向数据动态模型的稳健统计推断
基于半参数模型的纵向数据的稳健统计推断方法
复杂数据下半参数可加模型的统计推断