复杂数据下众数回归模型的变量选择及统计诊断研究

基本信息
批准号:11561075
项目类别:地区科学基金项目
资助金额:34.00
负责人:李会琼
学科分类:
依托单位:云南大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:杨春燕,张理,潘东东,陈丹,唐安民,王倩,句媛媛,严晓东
关键词:
变量选择众数回归模型缺失数据纵向数据统计诊断
结项摘要

Many robust regression methods, such as median regression and MM-estimators require symmetries in conditional distributions in order to achieve good performance. Mode regression model is well justified in situations where conditional distribution are highly skewed and outlier. Thus,Mode regression model is potentially a very useful addition to current data analysis tools, which is the same as mean regression、median regression and quantile regression model. However, using the mode regression model to solve current data,we often encounter missing data、measurement error data、censored data and longitudinal data. Meanwhile, some of data sets can result in larger error because of negligence and mistakes in data collect and arrangement. Therefore, we must consider statistical diagnostics for problems mentioned above. Again, most study papers for mode regression model are variable selection based on frequency. This project will propose a detailed statistical analysis methods to deal with complex mode regression model of complex data. The focus is on the estimator theorey,Bayesian variable selection、statistical diagnostics and local influence analysis of complex mode regression model from complex data.

许多稳健的回归方法,如中位数回归模型和MM估计,为了得到好的效果, 都要求条件分布是对称的。当条件分布f(Y|x)具有较大偏斜或异常值的时候,众数回归模型是非常好的工具。为此,众数回归模型跟均值回归模型、中位数回归模型和分位数回归模型一样是重要的统计分析工具。然而,利用众数回归模型解决实际问题的时候,一方面常常会遇到缺失数据、测量误差数据、删失数据和纵向数据等复杂数据,另一方面,我们所得到的数据集中有个别数据由于收集或整理过程中的疏忽和失误或其它原因而导致较大的误差,这些错误数据会不会较大的影响统计推断,所以必须进行统计诊断。另外,大多数对众数回归模型研究的文献,都主要是基于频率下的变量选择研究。因此本课题拟从复杂数据和复杂模型的角度,针对众数回归模型建立一套系统处理复杂数据的统计分析方法,重点讨论复杂数据下复杂众数回归模型的估计理论、贝叶斯变量选择、统计诊断方法和局部影响分析.

项目摘要

许多稳健的回归方法,如中位数回归模型和MM估计,为了得到好的效果,都要求条件分布是对称的。当条件分布f(Y|x)具有较大偏斜或异常值的时候,众数回归模型是非常好的工具。为此,众数回归模型跟均值回归模型、中位数回归模型和分位数回归模型一样是重要的统计分析工具。因此,本课题从复杂数据和复杂模型的角度,针对众数回归模型建立了一套系统处理复杂数据的统计分析方法,重点讨论复杂数据下复杂众数回归模型的估计理论、变量选择、统计诊断方法和局部影响分析。其次,对大维数据,研究了其总体协方差阵是否等于某个给定的正定对称矩阵的检验问题;最后,在不可忽略的缺失机制下,考虑了贝叶斯方法来检验非劣效性,并对不完全配对数据构造了贝叶斯置信区间和最大后验置信区间。在国内外重要学术刊物发表论文15篇,1人晋升为教授, 1人晋升为副教授。培养硕士研究生20名,指导本科生毕业论文12篇; 1人入选“云南省中青年学术和技术带头人后备人才”培养对象,2人入选“云南省万人计划青年拔尖人才”。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
4

基于LASSO-SVMR模型城市生活需水量的预测

基于LASSO-SVMR模型城市生活需水量的预测

DOI:10.19679/j.cnki.cjjsjj.2019.0538
发表时间:2019
5

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019

李会琼的其他基金

批准号:11026209
批准年份:2010
资助金额:3.20
项目类别:数学天元基金项目
批准号:11201412
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

海量数据下回归模型的变量选择及统计推断研究

批准号:11701386
批准年份:2017
负责人:林炳清
学科分类:A0403
资助金额:23.00
项目类别:青年科学基金项目
2

具有复杂结构的几类计数数据模型的变量选择和统计诊断研究

批准号:11561035
批准年份:2015
负责人:付英姿
学科分类:A0403
资助金额:35.00
项目类别:地区科学基金项目
3

高维数据下多因变量回归模型的统计推断

批准号:11401378
批准年份:2014
负责人:罗珊
学科分类:A0403
资助金额:22.00
项目类别:青年科学基金项目
4

混合型偏态数据下均值、中位数和众数回归模型的统计推断与算法研究

批准号:11861041
批准年份:2018
负责人:吴刘仓
学科分类:A0403
资助金额:39.00
项目类别:地区科学基金项目