In this project, we are going to study the statistical inference for the generalized semiparametric additive model with incomplete data. Generalized semiparametric additive model covers many common models. It maintains the interpretability and flexibility of models and avoids "the curse of dimensionality", featuring extensive range of application. In practical application, incomplete data is very common. For example, missing data and censored data. Ignoring these incomplete data can result in the loss of information or even the appearance of a biased conclusion. Therefore, it is of great significance to take into account the treatment of incomplete data in the generalized semiparametric additive model. This project will focus on the situation in which the dependent variable is missing at random and covarites include category variables. Given this situation, we will discuss a series of statistical inferences, including the estimation and asymptotic properties of parametric component and nonparametric component in the generalized semiparametric additive model, the empirical likelihood confidence intervals of the parametric component, the simultaneous variable selection of parametric component and nonparametric component, and we will discuss the variable selection of the semiparametric additive Cox model with current status data also with the category variables in covariates. At last, the performance of these methods will be illustrated by simulation and real data.
本项目拟研究不完全数据下广义半参数可加模型的统计推断问题。广义半参数可加模型涵盖了多种常见模型,它既保持了模型的可解释性,又兼顾了模型的灵活性,还能避免"维数祸根",具有广泛的应用范围。在实际应用中经常会出现不完全的数据,比如缺失数据和删失数据。如果不考虑数据的缺失或者删失,将导致信息损失甚至会得到有偏的结论,因此在不完全数据下考虑广义半参数可加模型的统计推断问题是重要而且有意义的。本项目旨在研究因变量随机缺失时,协变量中存在分类变量时广义半参数可加模型的参数和非参数部分的估计及其渐近性质、参数部分经验似然置信区间的构造、参数和非参数部分的同时变量选择等统计推断问题,以及I型区间删失数据下协变量中存在分类变量时半参数可加Cox模型的参数和非参数部分的同时变量选择。最后还将通过数值模拟和实际数据来展示所给方法的效果。
在实际收集获取数据的过程中经常会出现数据缺失不完整、测量存在误差的情况,这一类型数据我们统称之为不完全数据。在数据分析过程中,如果不考虑数据的误差或者缺失,将会导致信息损失甚至结论偏误,因此不完全数据的统计分析方法研究非常必要而且具有十分重要的实际意义。从统计模型方面来看,广义半参数可加模型涵盖了多种常见模型,它既保持了模型的可解释性,又兼顾了模型的灵活性,还能避免“维数祸根”,具有广泛的应用范围。本项目旨在研究广义半参数可加模型中不完全数据的统计推断方法及其实际应用。我们研究了自变量存在测量误差时部分线性模型的参数假设检验问题,构造了一系列检验统计量,并导出了原假设下的检验统计量渐进分布,用数值模拟的方法给出了检验功效并进行了比较。另外,研究了以广义半参数可加模型为工具解决信用评分领域的判别分类问题。针对信用评分模型中解释变量类型丰富,维数较高,好坏客户类型数量不均衡等特点,利用广义半参数可加模型对客户违约概率进行建模,并将Group LASSO方法应用于模型进行变量选择和估计。从实证的角度验证了Group LASSO方法能够很好地解决协变量存在分类变量时同时对参数部分和非参数部分进行变量选择的问题。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
中国参与全球价值链的环境效应分析
复杂数据下半参数可加模型的统计推断
参数与半参数模型下统计推断
面板数据半参数固定效应模型的统计推断
区间删失数据下几类半参数回归模型的统计推断