Modern statistical analysis often encounters high-dimensional data. For instance, in DNA microarray analysis, the data dimension is typically in the thousands, while the sample size is normally in the dozens or at most a couple of hundred. The majority of multivariate statistical procedures are no longer valid to deal with this kind of high-dimensional data, and new statistical procedures are needed to be developed. Our work is to analyze some basic statistical problems involving high-dimensional covariance matrices by using results from Random Matrix Theory. The problems we mainly considered include the estimation of spectral distributions of covariance matrices and some tests for covariance matrices. We will put forward a series of new methods for these problems and establish their limit theories in high-dimensional frameworks. To examine the effectiveness of the proposed methods, they will be compared with some existing ones in the literature by simulation studies. The proposed methods will also be applied to the analysis of some practical problems in the fields of biological statistics and econometrics, etc.
现代统计分析经常遇到高维数据的处理与分析问题。例如:在DNA微阵列分析中,数据维数通常高达几千,而可供推断使用的样本容量一般只有几十或几百个。在这种情况下,大部分经典的多元统计分析方法不再适用,提出新的统计推断方法已成为该研究领域迫切的需求。我们的工作是利用随机矩阵理论研究高维协方差矩阵的若干基本统计推断问题,研究内容包括协方差阵谱分布的估计和协方差阵结构的检验。我们将针对这些基本问题提出新的解决方案,建立其高维框架下的极限理论,并通过模拟实验检验新方法的有效性。所得理论结果还将应用于分析生物统计和计量经济等领域中的一些实际问题。
现代统计分析经常遇到高维数据的处理与分析问题。例如:在DNA微阵列分析中,数据维数通常高达几千,而可供推断使用的样本容量一般只有几十或几百个。在这种情况下,大部分经典的多元统计分析方法不再适用,提出新的统计推断方法已成为该研究领域迫切的需求。在本项目执行过程中,我们主要研究了三方面的内容:其一是关于总体谱的估计,其二是关于总体协方差矩阵的检验,其三是关于谱统计量的极限理论。在总体谱估计问题中,我们提出了离散总体谱阶数的估计,证明了估计的相合性。在总体协方差矩阵的检验问题中,我们在高维框架下建立一系列新的检验过程,包括球形阵检验、对角阵检验和分块对角阵检验。我们还将部分检验过程应用于基因数据分析和基于模型的聚类分析。在谱统计量的极限理论研究中,我们分别在混合分布和椭球分布下建立了样本协方差矩阵的极限谱分布和线性谱统计量的中心极限定理。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
钢筋混凝土带翼缘剪力墙破坏机理研究
气载放射性碘采样测量方法研究进展
大维样本协方差矩阵的几个统计推断问题研究
基于随机矩阵理论的高维数据统计分析
大维随机矩阵经验谱分布函数的收敛以及统计推断
线性统计推断与有关的矩阵理论