Missing data analysis is a hot topic in statistics in recent years and various methods have been developed for handling missing data. However, existing methods are mainly developed for independent data and the assumption of independence ignores the objective connections of units through various relationships such as natural relationships, social relationships and economic relationships, which lead to a complicated network structure. What's more, according to the applicant’s preliminary research, ignoring the network structure may result in serious bias for the parameter estimation and lead to wrong conclusions while making full use of network structure information can improve statistical efficiencies of estimators of the parameters and the missing values. In this project, we plan to exploit the valuable network structure information and adopt some parametric and semiparametric spatial regression models to systemically study the estimation methods and imputaion approachs for missing data with network structure based on preliminary results. We will develop suitble approaches which would have high computation efficency for handling large-scale data with missing values and network structure. We will also develop the model averaging estimation method for the focused parameter and further improve the statistical efficiency of the proposed impution method. This project not only has important theoretical significance to data analysis, but also provide some effective tools for real applications.
缺失数据统计分析是统计学国际前沿热点课题。现有缺失数据分析方法的一个基本假设是个体之间是相互独立的。事实上,个体之间的普遍关联是客观存在的,这种关联关系把个体连接成一个复杂的网络结构,包涵了极具价值的信息。申请者前期研究表明,忽略个体之间的网络结构关系,有可能导致参数估计的偏倚和错误的结论;充分利用网络结构信息,可以大幅度提高缺失数据参数估计和缺失值插补估计的统计效率。本项目拟基于前期对于缺失数据等方向的研究基础,充分挖掘个体之间的网络结构信息,采用一类参数空间回归模型和半参数空间回归模型,系统研究包含网络结构缺失数据的统计建模理论和缺失值插补方法;针对实践中网络结构的“大规模”特点,发展一类网络结构缺失数据的大数据统计建模理论及插补方法,并从模型平均方法的视角深入研究兴趣参数的模型平均估计,提高缺失值插补的统计效率。本项目研究具有重要理论意义,并为经济金融领域具体实践提供有效工具。
缺失数据统计分析是统计学国际前沿热点课题。现有缺失数据分析方法的一个基本假设是个体之间是相互独立的。事实上,个体之间的普遍关联是客观存在的,这种关联关系把个体连接成一个复杂的网络结构,包涵了极具价值的信息。充分利用网络结构信息,可以大幅度提高缺失数据参数估计和缺失值插补估计的统计效率。本项目充分挖掘个体之间的网络结构信息,采用一类参数空间回归模型和半参数空间回归模型,系统研究了包含网络结构缺失数据的统计建模理论和缺失值插补方法;针对实践中网络结构的“大规模”特点,发展一类网络结构缺失数据的大数据统计建模理论及插补方法,并从模型平均方法的视角深入研究兴趣参数的模型平均估计,提高缺失值插补的统计效率,创新性给出了缺失数据基于网络结构关系统计建模理论,证明了回归参数估计和缺失值预测估计的极限性质,具有重要理论意义。.在应用研究层面,这些研究成果,在国内视角,把网络结构数据分析理论成果应用于解决金融安全领域重要议题,以112家重要金融机构为研究对象,构建四个传染渠道的风险传染网络,建立高阶网络自回归模型,衡量金融机构间风险传染的程度;在国际视角,把握系统性金融风险的传染性本质和多源头、多渠道耦合的特征,以亚洲、大洋洲、欧洲、美洲共20个主要国家为节点,搭建全球系统性金融风险关联网络,构造国家风险指数测度20国的国家金融风险水平,构建网络自回归模型测度全球系统性金融风险水平,创新性构造国家系统重要性指数和系统脆弱性指数,评估中、美、英三国在风险网络中的重要性及抗风险能力。这些研究成果对于我国金融安全实践具有较好意义。. 本项目在Statistica Snica、Statistics and Its Interface等统计学国际高水平期刊发表或接收学术论文6篇,完成相关领域研究生毕业论文12篇,培养教授1名,副教授1名,研究生12名,服务国有大型企业1家,从理论和应用层面,较好地完成了本项目的研究任务。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
论大数据环境对情报学发展的影响
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
基于LASSO-SVMR模型城市生活需水量的预测
圆柏大痣小蜂雌成虫触角、下颚须及产卵器感器超微结构观察
缺失数据下半参数回归模型的稳健估计及变量选择方法研究
不可忽略缺失数据分位数回归模型和变量选择方法及其应用
随机右删失数据半参数回归模型的光滑FIC平均估计理论及其应用
含有缺失值的纵向数据回归模型的稳健推断