Literature on the Gini index almost focuses on complete data. However, censored or missing data are common in practice. Therefore, this program studies the Gini index estimation and testing for censored or missing data. We consider four scenarios: independent censoring, dependent censoring, missing at random and missing not at random. Under every scenario, this program proposes both normal approximation and empirical likelihood methods for the Gini index estimation and testing. We will prove the asymptotic properties of the eight proposed methods, and evaluate their finite sample performance using simulations. In addition, we will apply our methods to the CEPII data and ECHP data for empirical analysis. .The conventional Gini index methods are unreliable with censored or missing data. However, our methods can estimate the Gini index using censored or missing data. In particular, when the censored or missing data contains the income variable, our methods can provide reliable estimate for the income Gini index. Therefore, our study can help advance the income distribution reform.
关于基尼系数的文献几乎集中在完整数据上。但是,删失或缺失数据在现实中非常普遍。为此,本项目研究删失或缺失数据下基尼系数的估计与检验。我们考虑了四种情形:独立删失、依赖删失、随机缺失和非随机缺失。在每一种情形下,我们提出基尼系数估计与检验的正态逼近方法和经验似然方法。本项目将证明这八种方法渐近性质,并通过数值模拟考察这些方法在有限样本时的表现。此外,我们将本项目提出的这些新方法运用到两个微观经济数据库CEPII和ECHP上,做两个经验研究。.通常的基尼系数方法在删失或缺失数据时不再可靠,而我们的方法能系统性解决这个问题,从而能够利用删失或缺失数据去估计基尼系数。尤其,当含收入变量的微观调研数据库存在删失或缺失问题时,我们的方法能够可靠地估计收入基尼系数,这对收入分配改革具有重要意义。
收入分配与效率和公平密切相关,因此一直是政策制定的关注焦点和经济研究的重点领域。现实的经济数据通常具有复杂性,如数据删失和缺失。去掉或忽视删失或缺失数据,都会带来对不平等程度估计的偏误,这有有损政策评估和政策建议的严谨性。为此,本项目主要在删失或缺失数据下,从以下几个方面展开研究,在项目资助下,共计发表SSCI论文4篇,SCI论文4篇,CSSCI论文5篇,其中以第一作者发表SSCI或SCI论文5篇。.1..本项目在独立删失和依赖删失两种情形下,基于逆概率加权思路去校准删失带来的偏误,研究了相应的基尼系数估计量。研究了该估计量对数据删失机制的适用性及其大样本性质,并用蒙特卡洛模拟考察估计量小样本的表现。此外,该估计量在更复杂的删失机制下的稳健性也进行了研究。研究成果SCI发表论文1篇;.2..考虑了政策评估时遇到的数据缺失情形,即在政策评估时,遇到的处理组和控制组的反事实情形观测不到。本项目基于处理效应思路,研究了用于评估政策对基尼系数影响的有效半参数估计量。具体而言,通过构建非参数的倾向得分概率,然后去校准数据缺失对处理组和控制组基尼系数估计带来的偏误,从而得到政策对基尼系数影响的估计量。研究了该估计量达到了半参数估计量的有效边界的性质及其渐近性质,同时用数值模拟研究该估计量小样本中表现。研究成果在SSCI发表1篇;.3..在理论上,本项目研究了三个计量模型:删失数据下的加权分位数回归模型,含删失解释变量的离散选择模型,以及两组基尼系数差的经验似然置信区间。前两个解决了删失数据对传统计量模型偏误的影响,后一个模型所构建的置信区间在小样本中表现良好。此外,在一个南北两国出口竞争双寡头模型中,研究贸易自由化对出口国环境政策的战略选择、环境质量及国家福利的影响。后续,研究还将进一步完善辅助信息改进不平等指数估计效率,删失数据下不平等指标分解,以及删失数据时断点回归设计下的动态处理效应模型等。研究成果在SSCI发表1篇,SCI发表2篇, CSSCI发表1篇。.4..在应用方面,本项目通过使用家庭数据研究了我国城镇家庭碳排放的不平等程度及其来源,还研究了南北差异性与环境战略,及家庭信贷等问题。研究成果在SSCI发表2篇,SCI发表1篇,CSSCI发表4篇;.5..基于本课题的支持,培养毕业硕士生4名,选题均针对删失或缺失经济数据,与项目密切相关。构建了具有特色的研究团队。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
粗颗粒土的静止土压力系数非线性分析与计算方法
宽弦高速跨音风扇颤振特性研究
一种改进的多目标正余弦优化算法
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
区间删失下时变系数Cox 模型的贝叶斯方法研究
删失长偏置数据的非参数函数估计
区间删失数据的半参数回归模型的有效估计方法
删失与缺失并存的生存数据的降维理论及应用研究