This project will conduct statistical inference for two kinds of data with complicated autocorrelation structures: functional magnetic resonance imaging (fMRI) data and biological data with tree-structured autocorrelation; particularly, we will study the high-dimensional autocovariance matrix estimation problem encountered in the process of statistical inference. The two types of data have no replication and the autocorrelation structures are complicated: the error process of fMRI data is a non-stationary time series; the autocorrelation structure of the evolutionary biological data is highly related to the species’ genealogical tree. Estimating the autocovariance matrix is important when analyzing the data, but the existing estimation methods are not applicable here. We aim to develop methods for high-dimensional autocovariance matrix estimation and make statistical inference for the two types of data. In this project, we will address the following issues: (1) perform semiparametric inference for fMRI data and solve the temporal autocorrelation under non-stationary time series assumption; (2) analyze the tree-structured data by linear model, focus on estimating the autocovariance matrix of the error, demonstrate the convergence rate of the estimate and study the optimal convergence rate.
本项目将对两类具有复杂自相关结构的数据进行统计推断:功能性核磁共振成像(fMRI)数据和分层自相关的生物数据,并重点研究统计推断过程中遇到的高维自协方差矩阵的估计问题。上述两种数据的特点为没有重复观测值且自相关结构复杂:fMRI数据的误差项为非平稳时间序列,分层自相关的生物数据的自相关结构与物种进化树结构有关。在对这两种数据进行统计推断的过程中,估计误差项的自协方差矩阵非常重要,而现有的估计方法对这两类数据并不适用。本项目拟研究高维自协方差矩阵的估计方法并对这两种有代表性的数据做出统计推断。具体的研究内容包括:(1)研究fMRI数据在半参数模型下的统计推断,在非平稳时间序列假设下解决误差自相关性问题。(2)研究具有树状自相关结构的生物数据在线性模型下的统计推断,重点对误差项的自协方差矩阵进行估计,获得矩阵估计的收敛速度,进而论证该估计的最优收敛速度。
随着高性能计算机的大量普及,收集、存储高维数据变得成本低廉、操作方便,针对高维数据的分析也越来越重要。同时高维数据也对传统的统计方法提出了难题和挑战。该项目主要针对高维数据研究了以下问题:1.高维协方差矩阵及其逆矩阵的估计,以及半参数模型误差协方差矩阵的估计在脑图像(fMRI)数据中的应用,2.高维一般线性模型的稳健估计与推断的稳健性质,如影响函数(influence function)与breakdown point。具体的,我们提出了带有L1范数惩罚和条件数限制的高维协方差矩阵及逆矩阵的估计,并论证了估计的相合性,进而提出了数据驱动的调和参数的选择方法;针对fMRI数据,在半参数模型下,我们提出了误差项为非平稳时间序列的协方差矩阵的估计,并结合局部线性方法对参数部分做了假设检验,进而论证了检验统计量的渐进卡方分布;针对一般线性模型,我们研究了稳健的M估计以及稳健的Wald检验,论证了在数据受到污染的情况下检验统计量的渐进水平和功效依然在理论值的附近;对高维逻辑回归模型,我们计算了带有惩罚的极大似然估计的breakdown point。上述研究工作的重要意义在于,在方法上对高维协方差矩阵的研究提供了有效的技术工具,提高了协方差矩阵及逆矩阵估计在有限样本下的表现;在应用上对fMRI数据的分析提供了更精确的方法,避免了由于模型识别错误带来的误差;在理论上分析了现有的一般线性模型中稳健估计和检验方法的稳健性质,对这些稳健方法的有效性提供了理论支持。这些工作对高维数据的研究进行了一定的完善和补充,在理论和应用上具有一定的贡献。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
基于被动变阻尼装置高层结构风振控制效果对比分析
基于改进LinkNet的寒旱区遥感图像河流识别方法
智能煤矿建设路线与工程实践
二维FM系统的同时故障检测与控制
复杂纵向数据的统计推断
复杂空间点过程数据的统计推断
复杂数据下结构突变模型的统计推断及应用
两类复杂数据情形下的Fiducial推断