高维模型误差项分布的研究及应用

基本信息
批准号:11771361
项目类别:面上项目
资助金额:48.00
负责人:刘婧媛
学科分类:
依托单位:厦门大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:钟威,许杏柏,李木易,杨亚星,田露,郝智慧
关键词:
高维统计推断高维因果推断交叉验证思想误差项分布窗宽选择
结项摘要

In the era of “big data”, high dimensional and ultrahigh dimensional data attract much interest, represented by fields like bioinfomatics, statistical genetics, and finance, among others. The increasing data dimension brings tremendous challenges to traditional statistical tools, especially from the perspective of statistical inferences, such as hypothesis testing, confidence interval, prediction, and causal inference. Most statistical inferences, furthermore, rely on the study of the distribution of the error in the model. In this project, we will first discuss the limitations of traditional statistical methods for exploring error distributions based on various high dimensional models. The limitations consist of, but are not limited to, the nonignorable estimation bias when the model dimension is much larger than the sample size. We then develop new estimation methods based on the idea of refitted cross validation, and estimate the error variance function, or density function of error. We will carefully study their asymptotic properties, and provide a range of application scenarios, such as high dimensional causal inferences. There are three main research topics in this project. First, we explore the estimation of error variance function in nonparametric and semi-parametric models, such as varying coefficient models. We will utilize the idea of blocked coordinate descent algorithm and refitted cross validation in the procedure. Secondly, we focus on the modified kernel density estimation of error distribution under high dimensional setting, and prove its asymptotic unbiasedness, consistency and asymptotic normality. We also discuss the bandwidth selection, which is the most essential issue in the kernel density estimation. Finally, we will illustrate the usage of the aforementioned tools in various methodologies. For instance, density estimation of error distribution can be used in high dimensional propensity score matching in causal inference.

在“大数据”时代,高维数据引起人们越来越多的关注。但数据维度的提升为传统分析方法带来很多挑战,特别是统计推断方面,如假设检验、预测、因果推断等。而多数统计推断都需要研究模型误差项分布。我们以此为出发点,讨论在各种模型中,传统方法在误差分布研究中的弊端,如不可忽略的渐进估计偏差等。同时,我们提出基于重复交叉验证思想的误差方差函数估计、误差密度函数估计等,并把改进后的误差项分布估计应用于高维因果推断等领域。我们拟进行三个子项目。第一个子项目中,我们探讨非参数和半参数模型的误差项分布。我们将给出基于分组坐标下降和重复交叉验证思想的方差函数估计方法并研究其渐进理论。第二个子项目集中讨论误差密度函数的估计,给出该估计的相合性、渐进无偏性等,并讨论在核密度估计中至关重要的窗宽选择问题。第三个子项目将给出前两个子项目可以应用的方法论领域,包括稳健回归,分位数回归,及高维因果推断中的倾向评分匹配问题。

项目摘要

本项目聚焦在高维数据的建模中误差项分布问题研究,该研究在假设检验、预测、因果推断等统计推断领域有着广泛的应用。我们以此为出发点,讨论在各种模型中,传统方法在误差分布研究中的弊端,如不可忽略的渐进估计偏差等。为了解决这类问题,我们提出了基于重复交叉验证思想的误差方差函数估计、误差密度函数估计等,并把改进后的误差项分布估计应用于高维因果推断等领域。具体而言,我们进行了三个子项目:(1)我们探讨非参数和半参数模型的误差项分布。我们给出了基于分组坐标下降和重复交叉验证思想的方差函数估计方法并研究其渐进理论。(2)我们集中讨论了误差密度函数的估计,给出该估计的相合性、渐进无偏性等,并讨论了在核密度估计中至关重要的窗宽选择问题。(3)我们给出前两个子项目可以应用的方法论领域,包括稳健回归,分位数回归,及高维因果推断中的倾向评分匹配问题。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
2

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
3

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
4

钢筋混凝土带翼缘剪力墙破坏机理研究

钢筋混凝土带翼缘剪力墙破坏机理研究

DOI:10.15986/j.1006-7930.2017.06.014
发表时间:2017
5

气载放射性碘采样测量方法研究进展

气载放射性碘采样测量方法研究进展

DOI:
发表时间:2020

刘婧媛的其他基金

批准号:51402065
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:11401497
批准年份:2014
资助金额:22.00
项目类别:青年科学基金项目

相似国自然基金

1

回归模型下随机误差项条件分布的两类约束性检验问题

批准号:11701034
批准年份:2017
负责人:牛翠珍
学科分类:A0402
资助金额:24.00
项目类别:青年科学基金项目
2

高维扩散方程源项反问题及其在数值微分中的应用

批准号:11561003
批准年份:2015
负责人:王泽文
学科分类:A0505
资助金额:35.00
项目类别:地区科学基金项目
3

基于广义二端口12项误差模型的多端口矢量网络分析仪校准及误差修正技术

批准号:60871008
批准年份:2008
负责人:赵永久
学科分类:F0118
资助金额:33.00
项目类别:面上项目
4

测量误差和随机缺失下高维稀疏模型的统一纠偏理论及误差界分析

批准号:11801168
批准年份:2018
负责人:杨晶
学科分类:A0403
资助金额:22.00
项目类别:青年科学基金项目