基于惩罚似然和经验似然方法的高维数据假设检验问题研究

基本信息
批准号:11701023
项目类别:青年科学基金项目
资助金额:24.00
负责人:王珊珊
学科分类:
依托单位:北京航空航天大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:黄蕊,刘瑞平,于洋,顾杰,胡杰,王志超
关键词:
检验统计量假设检验稀疏性高维数据惩罚方法
结项摘要

Among the high-dimensional data analysis, hypothesis testing for high-dimensional data becomes a hot topic. The existing researches on this issue mainly focus on significant testing for regression coefficients, one/two-sample test of high-dimensional means or covariance matrix, and so on. Yet for the hypothesis testing for high-dimensional data, there are still some basic theoretical issues, which require further study. This project aims to propose a new paradigm that synthesizes and broadens the theories and methodologies of hypotheses testing for high dimensional data based on the penalization and (empirical) likelihood methods. We focus mainly on the following three topics: 1) Theory and method for significant testing of partial covariates using the penalization and likelihood ratio methods; 2) In the parametric likelihood framework, establishing theory and method for significant testing of the whole covariates with sparse restriction; 3) In the non-parametric empirical likelihood framework, establishing theory and method for significant testing of the whole covariates with sparse restriction. Using the idea of partial penalization and sure independent screening, we propose new test statistics for each case, and prove the corresponding asymptotic distributions under the null and the local alternative hypotheses. We also develop the efficient algorithm for these proposed methods, which facilitates theirs application in the statistical analysis of financial or genetic data. The results of this research have both theoretical and practical importance, i.e. this project not only will develop the new (empirical) likelihood ratio test methods for high-dimensional sparse data, but also will provide new methods and theoretical support for analyzing the high-dimensional data encountered in areas such as biomedicine, financial economics and so on.

高维数据分析中,高维假设检验是当今统计研究的热点。已有的许多研究集中在高维回归参数显著性检验、单(两)样本均值或协方差矩阵检验等。然而,高维数据检验领域仍存在一些基础理论问题值得进一步研究。本项目致力通过惩罚和(经验)似然方法系统构建并深化高维数据假设检验理论。将着重开展:1) 基于惩罚似然方法的部分变量显著检验理论与方法;2) 似然情形下,带稀疏限制的全局变量显著检验理论与方法;3) 经验似然情形下,带稀疏限制的全局变量显著检验理论与方法。基于部分惩罚和扫描思想,分别构造新的检验统计量,探讨统计量在原假设和局部备择假设下的渐近性质。在理论研究过程中,提出简便高效的计算方法,并应用到金融、基因数据的统计分析。本项研究将在高维稀疏假设下发展新的高维(经验)似然比检验方法,具有重要的理论意义;项目的研究成果将为处理生物医学及金融经济学等领域中的高维数据分析提供有力的方法保证,具有较高的应用价值

项目摘要

随着科学技术的快速发展,高维数据随处可见,比如基因、金融、文本数据等。这些数据中,变量维数随样本量变大甚至远远超过样本量,并具有稀疏特征,这给传统的统计理论和方法带来很大的挑战。因此如何在有限样本、数据维数高且稀疏情形下建模并对感兴趣变量进行显著性检验是统计学研究中的热点。因此,本项目致力通过惩罚和(经验)似然方法系统构建并深化高维数据假设检验理论,着重开展了1)基于惩罚似然方法的部分变量显著检验理论与方法;2)似然和非参数经验似然情形下,带稀疏限制的全局变量显著检验理论与方法。针对两类稀疏假设检验问题,基于部分惩罚和扫描思想,构造了新的检验统计量,探讨统计量在原假设和局部备择假设下的渐近性质,并提出简便高效的计算方法。此外,在大数据时代,除超高维和稀疏性挑战外,数据形态呈现多源性。它们可能是普通的数值型数据,也可能是各种类型的复杂数据,例如,某种表达整体比例结构数据(成分数据),甚至是以很高频率采集的几乎连续的数据(函数数据),或者同时包含多种数据类型等等。基于以上考虑,借鉴高维惩罚、扫描思想和非参数技术,我们对项目的研究方向进行了两方面的拓展:3)在超高维数据的变量选择与非参数统计建模方面,提出了基于Gram-Schmidt变换的复杂数据变量扫描方法;部分线性单指标模型的贝叶斯分位数回归及变量选择;基于非参数特征增强方法的高维数据分类方法;4)在高维复杂数据分析方面,研究了多元成分数据的SIR降维方法、稀疏凸聚类、增量算法和线性混合效应模型;函数空间自回归模型的稳健估计和空间偏最小二乘回归模型;多特征纵向复杂数据的线性混合效应模型和多特征复杂数据协变量的空间自回归建模方法。最后,本项目还以碳排放计量建模、污水处理中的能耗分析、网络安全行为攻击行为识别等实际问题作为实证研究,为政府决策提供了重要的参考依据。本项目按原计划进行,在上述各方面及相关领域都有较深入的研究,共计发表21篇学术成果,丰富了高维稀疏数据统计推断的基础理论与分析技术,具有重要的应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
3

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
4

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

王珊珊的其他基金

批准号:71461023
批准年份:2014
资助金额:34.00
项目类别:地区科学基金项目
批准号:71203047
批准年份:2012
资助金额:21.00
项目类别:青年科学基金项目
批准号:41775113
批准年份:2017
资助金额:68.00
项目类别:面上项目
批准号:81870424
批准年份:2018
资助金额:25.00
项目类别:面上项目
批准号:21506171
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目
批准号:31401590
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:61601450
批准年份:2016
资助金额:19.00
项目类别:青年科学基金项目
批准号:61871371
批准年份:2018
资助金额:67.00
项目类别:面上项目
批准号:81601277
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目
批准号:71673069
批准年份:2016
资助金额:47.00
项目类别:面上项目
批准号:41402296
批准年份:2014
资助金额:29.00
项目类别:青年科学基金项目
批准号:81402470
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:81401970
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:21805305
批准年份:2018
资助金额:25.30
项目类别:青年科学基金项目
批准号:81902812
批准年份:2019
资助金额:21.50
项目类别:青年科学基金项目
批准号:41405117
批准年份:2014
资助金额:26.00
项目类别:青年科学基金项目
批准号:41706166
批准年份:2017
资助金额:24.00
项目类别:青年科学基金项目
批准号:21301039
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:41006052
批准年份:2010
资助金额:22.00
项目类别:青年科学基金项目
批准号:71303162
批准年份:2013
资助金额:20.00
项目类别:青年科学基金项目

相似国自然基金

1

基于惩罚似然的变量选择方法及其在高维数据模型中的应用

批准号:71803001
批准年份:2018
负责人:朱艳玲
学科分类:G0301
资助金额:17.00
项目类别:青年科学基金项目
2

基于经验似然方法的保序推断

批准号:11101091
批准年份:2011
负责人:郁文
学科分类:A0403
资助金额:20.00
项目类别:青年科学基金项目
3

不完全数据的经验似然和经验熵研究

批准号:11171230
批准年份:2011
负责人:何书元
学科分类:A0402
资助金额:45.00
项目类别:面上项目
4

缺失数据下基于经验似然的稳健推断函数

批准号:11201174
批准年份:2012
负责人:刘天庆
学科分类:A0402
资助金额:23.00
项目类别:青年科学基金项目