Hard-to-access populations are in acute need for social support, management and service across different societies in the world. However, due to the hard to access properties, most of these groups are out of the scope of social services, and the characteristics of their behavior, psychological status and living style are mostly unknown to the general population, bringing great challenge to the prevent and control of infectious diseases, social security and public management. To overcome these difficulties, this project aims to study the method of pattern mining for hard-to-access population and to evaluate key network sampling approaches in the context of internet and big data. By applying the network sampling approach on the internet, we will explore alternative designs of sampling process and key factors to the representativeness of samples. Based on large amount of open source data, we further investigate methods for analysis of characteristics and behavior pattern of hard-to-access population, including data retrieval, online activity analysis, text mining and analysis of their social networks. Based on this, we will try to find key individuals and design and evaluate effective intervention strategies. The outcome of this project is expected to provide effective methods and technologies for scientifically and systematically studying hard-to-access population, and would be of great significance to the development of theories in management of public security and public health.
难接触人群在国内外不同的社会环境中均为亟需提高社会支持、管理和服务的对象。然而,由于其难接触的特性,导致大量群体均处于社会服务盲区,其行为特点、心理状态、生活方式等均不为大众所知悉,由此给传播性疾病预防与控制、社会安全与公共管理等带来巨大的挑战。本项目致力于研究在互联网大数据背景下,难接触人群特征挖掘方法及网络抽样关键技术。通过将网络抽样方法应用到互联网数据获取中,探索基于现有技术手段的网络数据抽样实施方法及其可代表性影响要素。在获取大量开源数据的基础上,进一步探索难接触人群群体和行为特征挖掘的基础方法,包括数据获取方法、网络社区活动分析、文本挖掘、社交网络构建和分析等。通过对在线社区难接触人群特征挖掘和分析,找到关键人群节点,设计和评估干预策略。项目成果有望为科学、全面地了解和干预难接触人群提供有效的技术手段和理论基础,对我国公共卫生、公共安全等管理问题具有重要的理论和实践意义。
自获得国家自然科学基金面上项目“基于在线网络社区的难接触人群特征挖掘及抽样关键技术研究”(71771213)以来,课题组从2017年下半年开始组织和实施相关研究工作,通过继承和延续课题申请人前期在国际合作中积淀的研究基础,围绕难接触人群抽样算法设计、在线社区网络数据获取、移动社交平台数据挖掘等开展了细致深入的工作。自立项以来,已在相关领域开展多项合作研究,发表标注项目学术论文40余篇,其中包括《Nature》、《Nature Microbiology》、《National Science Review》、《Omega》、《Decision Support Systems》、《Naval Research Logistics》、《IEEE Transactions on Network Science and Engineering》等多篇综合类、管理学类和复杂系统研究权威期刊和中文大数据领域权威期刊《大数据》、《中国计算机学会通讯》等。形成29份数据分析报告和政策建议,其中6份被中共中央办公厅、国务院办公厅采用, 3份提交至浙江省疾控中心。相关研究成果获湖南省高等教育教学成果特等奖,军队级教学成果一等奖,教育部科技进步二等奖,中国仿真学会自然科学一等奖,中国仿真学会自然科学二等奖;获国家专利授权3项;成果被科技日报、解放军报、人民日报、新华网、BBC、New York Times、Science Daily、MIT等国内外媒体和机构关注和正面广泛报道。申请人本人也在2020年获国家杰出青年科学基金资助, 并于2021年获湖南省青年科技奖。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
城市轨道交通车站火灾情况下客流疏散能力评价
基于FTA-BN模型的页岩气井口装置失效概率分析
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
基于社会网络和规范的自治在线社区方法及关键技术研究
基于模体挖掘面向在线社交网络中虚拟社区的群推荐系统研究
信息网络中基于结构及属性的社区挖掘研究
时间演化尺度下大规模社会网络特征分析与社区结构挖掘