In functional data analysis, we are often faced with sparsity and multivariate functional data. For example, EEG data of young children with autism spectrum disorder(ASD) and human mortality data for 90 to 110 years old from 1941 to 2010. These data are ranked on different dimensions according to time or spatial ordering and are sparsity in some dimension. To disclose a better description and understand of the time dynamics, the purposes of this project are: firstly, propose the novel approach to obtain a representation for partial derivatives. Some asymptotic results of the proposed methods will be established. The proposed approach will be employed to an human mortality database and shown that the time dynamic can be reasonable recovered. Secondly, functional regression model where the response is the partial derivative of sparsity and multivariate functional data and covariate is vectors will be built. The feasible method of estimation will be proposed and further applied to therapy of ASD disease. How to impact on ASD will be analyzed for vectors data and help doctors to develop scientific treatment programs. Lastly, we extent ROC analysis for the case where the level of marker is functional data rather than scale or vector. Asymptotic theory for the obtained ROC curve are derivied. The methods are illustrated through application to the diagnosis for ASD.
在函数型数据分析中,经常见到稀疏多元函数型数据,如:在不同时刻对自闭症患者测得的脑电图数据;在不同国家收集到的从1941年到2010年的90到110岁老人的死亡率数据。这些数据在不同的维度上都是按时间顺序排列,而且在某些维度上的观测是稀疏的。为了更好的揭示和理解这种数据的时间动态,本项目拟:(1)对稀疏多元函数型数据的偏导数提出有效的估计方法,研究其理论性质,并将发展的方法应用到老年人的死亡率数据,分析死亡率的变化趋势。(2)建立以稀疏多元函数型数据的偏导数为响应变量,非函数型数据为协变量的函数回归模型,提出可行的估计方法,进一步将发展的模型和估计方法应用到自闭症患者的脑电图数据,分析影响自闭症患者病情变化趋势的因素,为更好的找到治疗方案提供理论依据。(3)提出基于稀疏函数型数据导数(偏导数)的ROC分析,对诱导出的ROC曲线推断其理论性质,并将提出的方法应用到自闭症儿童的诊断。
稀疏多元函数型数据是当今社会多个领域经常碰到的数据类型,能否有效的对其进行统计推断具有非常重要的意义。本项目主要在稀疏多元函数型数据的偏导数估计、稀疏函数型数据的检验、动态面板数据的估计和稀疏函数型数据的建模及其应用四方面开展研究。稀疏多元函数型数据的偏导数估计,开展了以下工作。首先,结合边际函数主成分分析方法和局部多项式方法,对稀疏多元函数型数据的偏导数提出了有效的估计方法,研究了估计量的收敛速度,由于主成分估计方法中的基函数的导函数可能不是正交的,得到的稀疏函数型数据的偏导数估计可能不是最优的,于是提出了稀疏函数型数据偏导数的更新估计,再次证明了估计的理论性质,对提出的两种估计分别进行了模拟研究,并将发展的方法应用到老年人的死亡率数据,分析了不同国家死亡率的变化趋势。对稀疏函数型数据的检验,首先,我们提出了一种新的投影方法来检验两样本平均函数是否相等,提出了检验统计量,证明了检验的相合性,然后,利用稀疏函数型数据的两样本检验方法,构建了不完全观测高维数据的两样本检验方法。对动态面板数据的估计,我们研究了当观测时间和观测个体都很大,且带有个体特异性效应和非均匀时间趋势的动态面板数据的两阶段最小二乘估计和简单工具变量估计,证明了估计的渐近性质。针对稀疏函数型数据的建模及其应用,提出了函数多项式多指标模型。对连接函数和多项式系数的估计提出了一种迭代估计方法。我们也采用集成学习方法,结合Boruta算法和随机森林算法,对支气管肺发育不良建立了预测模型。总的来说,我们顺利完成了本项目的既定目标,并在本项目的支持下共完成15篇论文。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
基于LASSO-SVMR模型城市生活需水量的预测
多元函数型数据的统计深度及其应用研究
函数型数据的统计推断
函数型数据的统计推断
多元函数型数据的统计分析及其应用研究