基于偏相关系数截断法的超高维模型的变量选择

基本信息
批准号:11401497
项目类别:青年科学基金项目
资助金额:22.00
负责人:刘婧媛
学科分类:
依托单位:厦门大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:冯峥晖,李迎星,钟威,张传海,范云菲,张诗悦
关键词:
变量选择线性及部分线性模型偏相关系数椭圆分布超高维数据
结项摘要

The penalty-based variable selection technique is one of the appealing methods to identify significant variables in the high dimensional models. But for the ultrahigh dimensional models where the number of predictors increases exponentially with the sample size, an extra screening step is often needed to roughly reduce the model dimension. This project, however, aims to propose a different ultrahigh dimensional variable selection scheme, called the thresholded partial correlation approach (TPC). The TPC is based on the idea of partial correlation learning and the partial faithfulness for the ultrahigh dimensional linear models, and it can be extended to the partially linear models via the partial residual approach. This method relaxes the normality assumption of the predictors and responses to the elliptical contoured distribution, and does not need the two-stage procedure as most current methods do, in the ultrahigh dimensional setting, to obtain the final sparse model. Furthermore, we will establish the theoretical properties of this method under a different assumption framework from the literature, which allows us to broaden the usage of this variable selection scheme. We will prove the model consistency of the TPC and the sure screening property of the first step of TPC for both linear models and partially linear models. The simulation examples will be conducted to compare the TPC and the penalty-based variable selection approaches, and the application of this method to the genetic research and financial research will also be provided.

惩罚回归是在大数据模型中提取有用信息的办法之一。但对自变量个数随样本容量指数增长的超高维模型,我们通常需要一步额外的独立扫描步骤来降低模型维数。然而本项目旨在提出一种来源于不同理念框架的超高维变量选择方法——偏相关系数截断法。总体来说,此方法是基于偏相关系数体系以及部分忠实性理念的逐步检验法。它不仅可以处理超高维线性模型,也可以结合部分残差法扩展应用于超高维部分线性模型中。该方法将模型自变量和因变量的正态假设条件放宽为椭圆分布以适应真实数据通常面临的重尾性;它可以直接作用于超高维模型,无需进行传统的两步法;另外,为使本方法应用更加广泛,我们将从与传统方法不同的正则条件框架出发构造该方法的大样本性质,包括模型选择相合性、第一步检验的确定扫描性等。我们将利用模拟实验来比较偏相关系数截断法和传统的惩罚回归对于超高维模型的变量选择结果,并且将本方法应用于生物基因学领域和金融股票研究领域的数据分析。

项目摘要

惩罚回归是在大数据模型中提取有用信息的办法之一。但对自变量个数随样本容量指数增长的超高维模型,我们通常需要一步额外的独立扫描步骤来降低模型维数。然而本项目旨在提出一种来源于不同理念框架的超高维变量选择方法——偏相关系数截断法。总体来说,此方法是基于偏相关系数体系以及部分忠实性理念的逐步检验法。它不仅可以处理超高维线性模型,也可以结合部分残差法扩展应用于超高维部分线性模型中。该方法将模型自变量和因变量的正态假设条件放宽为椭圆分布以适应真实数据通常面临的重尾性;它可以直接作用于超高维模型,无需进行传统的两步法;另外,为使本方法应用更加广泛,我们将从与传统方法不同的正则条件框架出发构造该方法的大样本性质,包括模型选择相合性、第一步检验的确定扫描性等。我们将利用模拟实验来比较偏相关系数截断法和传统的惩罚回归对于超高维模型的变量选择结果,并且将本方法应用于生物基因学领域和金融股票研究领域的数据分析。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
4

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
5

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019

刘婧媛的其他基金

批准号:11771361
批准年份:2017
资助金额:48.00
项目类别:面上项目
批准号:51402065
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目

相似国自然基金

1

生存分析中变系数模型的超高维协变量的筛选研究

批准号:11401443
批准年份:2014
负责人:邓世容
学科分类:A0402
资助金额:22.00
项目类别:青年科学基金项目
2

删失数据超高维共线性模型的变量选择

批准号:11726616
批准年份:2017
负责人:董莹
学科分类:A0403
资助金额:10.00
项目类别:数学天元基金项目
3

删失数据超高维共线性模型的变量选择

批准号:11726615
批准年份:2017
负责人:唐年胜
学科分类:A0403
资助金额:20.00
项目类别:数学天元基金项目
4

超高维半参数回归模型的结构识别和变量选择问题研究

批准号:11401340
批准年份:2014
负责人:王明秋
学科分类:A0402
资助金额:23.00
项目类别:青年科学基金项目