This project mainly studies model selection problems in quantile regressions, with panel data (n as the number of panels, and T as the number of observations in each panel). The main focuses are as follows. I) We study panle data with fix n and diverging T. We increase the efficiency by composite quantile regression (CQR), and proceed to variable selection by adaptive LASSO penalty. We will prove that the penalized estimator enjoys nice asymptotic properties. II) We study panel data with diverging n and fixed T. We will consider the correlation structure within the panel by QIF method, and combining the CQR, the estimator will be more efficient. The adaptive LASSO will be applied for variable selection, and the asymptotic properties will be proved. III) We study high dimensional panel data with diverging n and fixed T. We will consider the correlation structure within the panel by QIF method, and LASSO and adaptive LASSO will be applied for dimension reduction and model selection. IV) We study quantile regression with censoring. Since the CQR is limited to the case in which ther errors have the same distribution, we will apply adaptive LASSO to penalize the differences in the coefficients at different quantile levels, and determine which quantile levels share the same coefficients and which ones do not. Correct model will be selected to improve the estimation efficiency. In this project, we will investigate the finite sample performance of the proposed methods by simulation studies, and apply the new methods to real data analysis.
本课题主要研究面板数据(面板个数n,面板长度T)分位数回归中的模型选择问题。主要研究内容有:一、研究n固定、T发散的情况,通过复合分位数回归(CQR)提高估计效率,并用ALASSO进行变量选择,证明理论性质;二、研究n发散、T固定的情况,利用QIF方法考虑相关结构,结合CQR,提高估计效率,并通过ALASSO进行变量选择,证明理论性质;三、研究n发散、T固定的高维面板数据,利用QIF方法考虑相关结构,采用LASSO和ALASSO两步惩罚的方法,研究降维和模型选择问题;四、研究带删失的情形,考虑到CQR要求误差同分布的局限,利用自适应LASSO对不同分位数水平上的系数差异进行惩罚,确定系数之间确实存在差异的分位数水平,选择正确的模型,提高估计效率。同时,在本课题的研究中,将通过丰富的计算机模拟,检验所提方法的有限样本性质,并将方法应用到实际问题分析中去。
面板数据、删失数据、分位数回归与模型选择以及它们的各种组合是统计研究中非常重要的内容。本课题主要研究内容和重要结果如下。.一、带相依误差项的复合分位数回归中的变量选择:对比OLS,CQR相对效率有一致下界,误差项来自厚尾分布时,相对效率可远超过1;估计量有变量选择相合性;为所复合分位数的个数选择提供依据。.二、纵向数据分位数回归中的估计效率的改进:对条件分位数回归进行经验似然估计,个体内部分位数得分函数的相关矩阵的逆用QIF近似,得到个体的权重,进行加权估计;个体内部有一定相关性,误差项来自厚尾或不对称分布时,比现有方法更有效。.三、固定删失数据在超高维分位数回归中的降维和变量选择:先对广义线性回归进行降维估计删失概率,后结合信息子集和惩罚方法进行两阶段降维和变量选择;变量选择相合,非零系数收敛速度最优。.四、随机删失数据中,通过惩罚方法自动检测自变量对响应变量各个分位数水平的影响的一致性:自适应LASSO和自适应Sup-norm均具有选择的相合性;先用自适应Sup-norm判定所有分位数水平上共同性,后对有差异的自变量利用自适应LASSO分段选择共同性。.五、加速生命测试数据中的稳健分位数回归:为加速生命测试(ALT)数据提供分位数回归方法;与传统参数模型相比,我们不假设参数分布,数据固定删失时计算有效,灵活建模;可处理无失效个体ALT数据。.六、删失数据分位数回归中由门限值效应引起的变点检验:使用逆概率加权对参数进行估计;检验统计量基于次梯度函数,临界值用自助法近似;第一类错误接近名义水平,功效快速趋于1。.七、线性分位数回归中的序贯变点检测:假定在一批历史数据中,系数结构没有变化,对接下来的数据采用基于次梯度函数的CUSUM-型检验。.八、保险费率厘定中的风险因子选择——零膨胀-泊松回归模型中的EM自适应LASSO变量选择方法:假定理赔次数服从零膨胀的泊松分布;EM自适应LASSO具有变量选择相合性,包括零膨胀部分和泊松部分。.九、单指标复合分位数回归中的参数检验和非参数函数的线性检验:所构造的参数部分检验统计量与非参数函数的检验统计量均具有卡方性。.十、OU型过程中的连续广义矩LASSO型估计量:以非零概率把零参数估计为零;数值结果显示,有很大的概率选择正确的结构。.科学意义:在统计理论上做出了贡献,为实际数据分析提供了合适的方法。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
带有交互效应的面板数据分位数回归
高维纵向数据分位数回归中的统计推断研究
截面个体变系数面板数据模型中的分位数回归方法及其应用
分位数回归中若干统计问题及其在气候变化和水文模型中的应用