Self-reporting data is the mainstay of many researches. However, when the survey involves sharing sensitive information of the respondents, such as sexual behavior, criminal activity, etc., privacy becomes a major concern and the biases are introduce by the misreporting. The traditional methods do not avoid asking respondents to report their own traits and their complex design always makes respondents feel confused and uncomfortable. And these methods do not take the sampling process into account, hence only qualitative conclusion can be reached. Considering there is no scientific statistical inference method for the sensitive variable, this project will focus the research of sampling design and indirect inference for sensitive problems with social network information. Two scenarios are considered, i.e., tradition surveys with sampling frames and the surveys on the social networking platform in which the sampling frames are unknown. In different scenarios, this project will design the sampling process with the corresponding sampling method like random sampling and random walk sampling, and it will introduce the specific estimators for the sensitive variables. The project is expected to propose a technical system for understanding and analyzing the important sensitive characteristics, tendencies and attitudes of the target populations. And it has the potential to provide the guidance and support for the government to understand the real characteristics of the population rapidly, formulate management plans rationally and allocate the resources scientifically.
通过统计调查收集自我报告数据是许多研究的重要基础。但是,当调查涉及到需要受访者分享自己的敏感信息,如性行为、犯罪活动等时,出于隐私保护的目的,受访者往往会对自身情况进行误报,对调查结果引入很大误差。当前针对敏感问题的调查方法本质上没有避免让受访者提供自身敏感信息,其复杂的调查设计还可能会让受访者有蒙蔽感,导致调查数据不可靠的问题更加严重。并且,由于没有考虑样本的获取方式和过程,传统方法无法支持科学、定量的统计推断。本项目将考虑传统调查场景和互联网社交平台数据收集场景,将网络抽样理论与传统调查、在线调查等方式相结合,进行针对敏感问题的抽样设计,提出间接有效的敏感信息统计推断方法,解决涉及敏感问题的调查研究中样本获取难、没有科学统计推断方法的问题,实现对目标群体重要敏感信息的特征、倾向、态度等的快速掌握和高效分析,为政府部门在相关领域迅速了解群体真实状况,合理制定干预方案等提供指导和支持。
自获得国家自然科学基金项目“基于社交网络的敏感问题抽样设计与间接统计推断方法”(71901067)以来,课题组围绕研究主线,针对基于社交网络的敏感信息收集策略、敏感问题抽样设计、敏感信息统计推断方法等方面开展了细致深入的工作。同时,课题组结合新冠疫情研究热点,围绕移动大数据、人口流动复杂性分析等方法也开展了一系列研究工作。在国家自然科学基金项目的支持下,项目组扎实攻研,共发表学术论文6篇,SCI论文4篇,其中包括综合类顶级期刊《National Science Review》、复杂网络权威期刊《Journal of Complex Networks》、1篇文章已被管理科学顶级期刊《管理科学学报》录用。同时,获得可视化分析大赛优秀奖1项。相关成果将网络抽样理论与传统调查、在线调查等方式相结合,进行了针对敏感问题的抽样设计,提出了间接有效的敏感信息统计推断方法,解决了涉及敏感问题的调查研究中样本获取难、没有科学统计推断方法的问题,建立了一种从敏感问题抽样设计到基于不同场景科学统计推断的理论方法和技术体系,能够实现对目标群体重要敏感信息的特征、倾向、态度等的快速掌握和高效分析,为政府部门在相关领域迅速了解群体真实状况,合理制定干预方案等提供指导和支持。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
黄河流域水资源利用时空演变特征及驱动要素
硬件木马:关键问题研究进展及新动向
城市轨道交通车站火灾情况下客流疏散能力评价
基于FTA-BN模型的页岩气井口装置失效概率分析
概率抽样设计及其统计推断方法
两阶段抽样设计及其统计推断方法
基于排序集抽样及其推广取样方法上的次序统计量以及统计推断
家系研究的统计推断与有偏二阶段抽样设计