Usually, the median, compared with the mean, is more simple and efficient measure for the center of variables which are censored. Therefore, .the censored median regression model provides a valuable complement to censored regression model with zero-mean errors. In the study of this project, we will focus ours most attention on the median regression models with censored responses. Based on the method of Least absolute deviations (LAD for short), the problems will be studied as follows. Firstly, we will propose LAD estimate for linear median regression models with interval censored responses and prove the asymptotic properties of the estimators. Secondly, using the LAD estimators, statistical inference based on empirical likelihood, random weighting, and bootstrap, respectivelly, will be studied. Then, we will study the EV median regression models with right censoring, doubly censoring or interval censoring respectivelly, and propose LAD type methods. Finally, penalty methods will be used to make model selection for linear median regression models with doubly or interval censored responses. This research will further improve the theories of censored regression model, and promote practical application of the model.
对删失数据回归模型而言,由于因变量的观测出现偏差,使用中位数作为因变量的"中心"的估计比使用均值要简单有效,因此,删失数据中位数回归模型成为均值回归模型的有效替代和补充。本项目将考虑因变量为删失数据时的中位数回归模型,基于最小一乘(LAD)的思想,从以下几方面展开研究:首先考虑因变量含不同类型的区间删失数据时的线性中位数回归模型的LAD估计问题,提出估计方法并证明其渐近性质;基于该LAD估计,分别使用经验似然、随机加权和bootstrap法讨论模型中参数的区间估计和假设检验等统计推断问题;分别对因变量为右删失、双侧删失或区间删失数据时的EV线性中位数回归模型,考虑参数的LAD型估计,以及基于该估计量的区间估计、假设检验等统计推断;分别对因变量为双侧删失或区间删失数据的线性中位数回归模型,使用罚函数的方法考虑变量选择问题。本研究将进一步完善删失数据回归模型的理论,极大的推进该模型的实际应用。
由于各种不同的原因,观测数据经常会出现删失的情况。删失数据的回归模型是统计中重要模型,也是实际中经常会用到的模型。对于删失数据回归模型而言,由于因变量的观测出现偏差,使用中位数作为因变量的“中心”的估计比使用均值要简单有效,除此之外,分位数的研究可以更好的刻画数据。因此删失分位数回归,包括删失中位数回归模型成为均值回归模型的有效替代和补充。本项目针对各种不同删失情形下的回归模型进行考虑。研究了区间删失数据的分位数回归模型的LAD估计问题,给出了点估计的方法及其性质,并考虑了模型参数的区间估计问题;针对双侧删失数据的中位数回归模型,研究了基于LAD估计和LASSO给出了模型选择的方法,并证明了方法的有效性;针对右删失数据的线性回归EV模型,给出了参数估计方法,并在一定条件下证明了估计量的大样本性质;针对污染数据中位数线性回归模型,考虑了参数的最小一乘估计,并证明了估计量的大样本性质;针对高维的线性回归模型,研究了调整的经验似然方法,并证明了方法的有效性;针对右删失数据混合回归模型,基于EM算法和M-估计的思想给出了参数的稳健估计方法。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
基于LASSO-SVMR模型城市生活需水量的预测
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
删失数据的回归分析
删失数据回归分析的若干问题
任意区间删失数据的统计分析
相依区间删失数据的统计分析