高维半参数模型的核机器学习方法及应用

基本信息
批准号:11701021
项目类别:青年科学基金项目
资助金额:24.00
负责人:荣耀华
学科分类:
依托单位:北京工业大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:程维虎,陈海清,曾婕,赵静,于美丞,肖士燕,蒋萌萌,王晓瑞
关键词:
核机器稀疏性高维数据半参数回归模型LASSO
结项摘要

The variable selection problem of high dimensional data is one of the hot and difficult problems in international statistical research. The problem of variable selection in semiparametric model has also gained lots of attention and research. According to the current literature, when the variable dimension is high, and their interactions are very complicated, it is very difficult to model all the interaction terms. Existing variable selection methods for the semiparametric model can not solve this problem effectively. To this end, this project aims to propose a class of Garrotized kernel machine estimation and variable selection method in semi-parametric models for high dimensional cross-sectional and longitudinal, discrete and continuous data, to study its large sample properties and effective high dimensional algorithms, to carry out large-scale simulation and empirical research. This is of great theoretical and practical value for enriching and developing the variable selection theory of high dimensional complex data.

高维数据的变量选择问题是国际统计学研究热点和难点问题之一。半参数模型的变量选择问题也获得了大量的关注和研究。据目前掌握的文献来看,当变量维数很高,而且它们的交互效应非常复杂时,对全部的交互项进行建模非常困难。现有半参数模型的变量选择方法尚不能有效解决这一问题。为此,本项目拟针对高维截面和纵向,离散和连续型数据,提出一类半参数模型Garrotized核机器估计和变量选择方法,研究其大样本性质和有效高维算法,开展大规模模拟研究和实证研究。这对于丰富和发展高维复杂数据下变量选择理论方法具有重要的理论意义和应用价值。

项目摘要

变量选择问题是国际统计学研究热点和难点问题之一。半参数模型的变量选择问题也获得了大量的关注和研究。据目前掌握的文献来看,当变量维数很高,并且它们的交互效应非常复杂时,对全部的交互项进行建模非常困难。现有半参数模型的变量选择方法尚不能有效解决这一问题。本项目针对离散型、连续型、生存数据,研究了半参数模型、广义半参数模型、Cox比例风险半参数模型的惩罚Garrotized核机器(Penalized Garrotized Kernel Machine, PGKM)估计和变量选择方法,研究了其大样本性质和有效算法,开展了大规模模拟研究和实证分析。研究表明该方法可更好的适应冗余变量存在的情形,同时允许预测变量与响应变量间存在复杂相关关系和预测变量间存在交互效应。模拟和实证结果表明当模型中不包含冗余变量时,所提出的三类PGKM方法与标准的核机器回归方法预测表现类似,但当事先不知相关预测变量时,本项目所提出的PGKM方法收获了更高的预测精度,这对于丰富和发展高维复杂数据下变量选择理论方法具有重要的理论意义和应用价值。一些补充资料,包括相应的R程序可从网上获取。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
5

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021

荣耀华的其他基金

相似国自然基金

1

高维序列数据的核学习方法及应用研究

批准号:61672157
批准年份:2016
负责人:陈黎飞
学科分类:F0605
资助金额:60.00
项目类别:面上项目
2

高维参数和半参数模型下的似然推断

批准号:11871263
批准年份:2018
负责人:蒋学军
学科分类:A0402
资助金额:55.00
项目类别:面上项目
3

稀疏高维半参数模型的稳健统计推断

批准号:11101063
批准年份:2011
负责人:王晓光
学科分类:A0402
资助金额:16.00
项目类别:青年科学基金项目
4

高维半参数回归模型中的若干检验问题

批准号:11401391
批准年份:2014
负责人:张君
学科分类:A0402
资助金额:22.00
项目类别:青年科学基金项目