Model selection is clearly crucial to statistical modeling and has been one of the hot topics in statistics. Model averaging approach, which includes model selection as one of its special case,is the frontier of statistical theory in an international context.Until now, research on model averaging has achieved remarkable results. However, most of these research were undertaken with independent identically distributed sample, and did not work for censored data which is common in real applications. What's more, preliminary research of the applicant shew that outliers might have significant impact on traditional model averaging method and the covariates affected the response differently in different quantile levels. Thus , to depict the character of the distribution of the response, one not only has to consider the influence of the covariates on the center of the response,but also infulence on other quantiles. In this project, on basis of the preliminary research, by means of the FIC criterion,combining the sepcial structure of randomly right censored data,in virtue of B-spline,martingale,the convexity lemma, matrix theory and bias-corrected techniques, we intend to systemicall build model averaging theory for semiparametric regression model with randomly right censored response via mean regression as well as quantile regression. Becides,we also intend to develop the traditional focused information criterion for one dimensional focused parameter to focused vector case as well as the corresponding smoothed FIC estimater of the focused vector.This project not only has important theoretical significance to data analysis, but also provide an effective tool for real applications.
模型选择是数据建模的关键环节,是统计学热点课题,而包含其为特例的模型平均问题是目前统计学国际前沿课题。目前模型平均方法的研究成果主要针对简单随机样本,尚不能有效解决现代应用领域常见的删失数据。申请者前期研究表明,异常值对模型平均估计的效果有显著影响,且在不同分位数水平上,协变量对响应变量影响不同,因此,为了全面描述响应变量分布特征,不仅需要考虑协变量对响应变量中心的影响,还应考虑对其他分位数的影响。本科题拟基于前期基础,借鉴FIC准则,结合随机右删失数据结构特点,针对半参数模型,分别从均值建模和分位数建模的角度,使用纠偏技术,运用B样条、鞅、凸引理和矩阵伦等理论工具,系统性建立随机右删失数据的模型平均估计理论体系,并深入发展针对单个兴趣参数的传统FIC准则,突破性解决兴趣向量的平均估计问题;把理论成果应用于实际数据分析。本项目内容不仅对数据分析具有重要理论意义,也将为应用领域提供有效工具。
缺失数据和删失数据是现代统计实践中常见的复杂数据类型,其统计建模理论研究一直统计学国际前沿课题。模型选择是统计建模的关键环节,而建立在模型选择之上的模型平均近年来发展成为热点研究方向,涌现了许多研究成果。然而,这些研究基本是针对独立同分布样本进行的,对于缺失数据和删失数据还不能够有效解决。另一方面,对于缺失数据的统计建模问题,现有理论方法的一个基本假设是个体之间是相互独立的。事实上,个体之间的普遍关联是客观存在的,这种关联关系把个体连接成一个复杂的网络结构,忽略个体之间的网络结构关系,有可能导致参数估计的偏倚和错误的结论。本项目针对缺失数据和删失数据的模型平均和统计建模问题进行了研究,主要工作包括以下几个方面:(1)研究了随机缺失数据的模型平均估计问题,采用对缺失数据进行借补的思想,构造子模型参数的两步估计,给出了兴趣参数的光滑FIC模型平均估计,证明了兴趣参数光滑FIC模型平均估计的渐近正态性;(2)研究了随机右删失数据的稳健模型估计问题,从分位数回归的角度,给出了随机右删失数据的光滑FIC模型平均估计,证明了估计的极限性质;(3)在随机右删失数据下,分别研究了半参数回归模型和半参数变系数模型的稳健模型平均估计问题,给出了兴趣参数的光滑FIC模型平均估计,并证明了估计的大样本性质;(4)针对一类参数空间回归模型和半参数空间回归模型,研究了包含网络结构关系缺失数据的统计建模理论;针对实践中网络结构的“大规模”特点,发展一类网络结构缺失数据的大数据统计建模理论及插补方法,提高了缺失值插补的统计效率。本项目研究具有重要理论意义,并为经济金融领域具体实践提供有效工具。. 本项目发表论文8 篇,在审论文5篇,出版学术专著1部,其中,发表SCI期刊论文 3篇,在审论文均为SCI期刊论文,参加国内外学术会议5次以上,指导毕业硕士生7名,获得校级优秀硕士毕业论文1篇。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
区间删失数据的半参数回归模型的有效估计方法
左截断区间删失数据的半参数回归分析及其应用
长度偏差右删失数据下剩余寿命模型的半参数推断
区间删失数据下几类半参数回归模型的统计推断