As an issue for dimension reduction of independent variables in the nonparametric regression, sufficient dimension reduction has received a lot of attention with many new methodologies and theories proposed. However, a related issue, the influence analysis of sufficient dimension reduction, has not received enough attention. The main results of sufficient dimension reduction, the estimates of structural dimension and dimension reduction space, are used in the nonparametric fitting of the regression function, so their robustness is important to the accuracy of the fitting. Hence, it is necessary to conduct the influence analysis to find out the aspects which outstandingly impact the results of dimension reduction. The existing influence analyses of sufficient dimension reduction are mainly based on case-deletion methods and their power to detect influential cases is limited, especially when masking effects exist among the influential points. In this project, we will conduct the local influence analyses of the structural dimension estimate and dimension reduction space estimate which focus on the detection of the influential cases under the joint perturbation schemes to improve the detecting power. As sufficient dimension reduction does not depend on any likelihood function and its main statistic is a space instead of a vector, none of existing methodology of local influence analysis can be applied to this issue. We will construct local influence measures of structural dimension estimate and dimension reduction space estimate for some sufficient dimension reduction methods and propose a process of data clipping based on the detection of influential cases to improve the robustness of these dimension reduction methods.
作为非参数回归中自变量降维的问题,充分降维很受关注,不断有新的方法和理论被提出,但有一个方面尚未得到足够的重视,那就是其影响分析.充分降维的主要结果,结构维数和降维空间估计,被用于回归函数的非参数拟合,其稳健性直接影响到拟合的质量. 因此, 有必要进行影响分析,找出对降维结果具有突出影响的因素并加以处理.现有成果中,充分降维的影响分析主要采用数据删除方法,其对强影响点的探测效率有限,在强影响点间存在掩盖效应时缺点尤其明显.本项目拟开展结构维数估计和降维空间估计的局部影响分析,研究在联合扰动模式下强影响因素的探测问题,提高探测能力.由于充分降维并不基于似然函数而主要统计量又是一个空间而非向量,故现有局部影响分析理论不适用于充分降维, 本项目将针对一些充分降维方法,建立结构维数估计和降维空间估计各自的局部影响评价体系,并基于探测结果,提出一个数据修剪过程,以期改善这些充分降维方法的稳健性.
围绕充分降维的局部影响分析,完成了下述工作:1. 基于正则迹相关系数构造了空间位移函数,并在该函数和联合扰动的基础上,建立了对于充分降维方法具有较好普适性的局部影响分析理论框架;2. 对所提出的方法,导出了仿射变换下的不变性等性质;3. 给出了关键统计量的直观几何解释;4. 对于一些应用广泛、有代表性的充分降维方法,建立了数据点对降维结果的局部影响评价体系,并基于局部影响评价结果,建立数据修剪过程,改善降维的稳健性,这些充分降维方法包括切片逆回归(SIR)、累积平均估计(CUME)、基于条件密度函数的最小平均方差估计(dMAVE)、主海森方向法(pHd)、切片平均方差估计(SAVE)、切片平均三阶矩估计;5. 提出了pHd方法在多元混合有偏椭球分布下的一种改进方式;6. 提出了几种充分降维方法在多元混合正态分布下的改进方式;7. 在多元混合正态分布下给出了一种不依赖回归方程形式假定的变量选择方法; 8. 给出了针对样本主成分子集的基于正则迹相关系数的局部影响分析方法。基于上述成果,共完成论文8篇,已在统计学国际知名SCI源期刊发表或在线发表2篇,拟投稿6篇,均已进行标注;已发表的论文中,1篇于2020年获得云南省第二十三次哲学社会科学优秀成果奖二等奖;依托本项目,负责人于2019年入选云南省中青年学术和技术带头人后备人才,获批云南省科技人才与平台计划项目1项(编号202005AC160026);培养毕业硕士9人,在读博士研究生2人;在学术会议上做报告4次。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
监管的非对称性、盈余管理模式选择与证监会执法效率?
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
转录因子KLF4靶向酪氨酸蛋白激酶血小板源性生长因子受体(PDGFR)诱导血管内皮细胞衰老的调控作用
充分降维理论中基于分布加权思想的压缩估计
多维因变量充分降维与多总体共同充分降维方法研究
基于四元数整体空间点表达和三维Gabor降维处理的人体姿态估计
回归中高维数据的“充分”降维