Study on the identification of internet users from multi-source data, the analysis of internet users and their social groups, has important academic significance and practical value. In response to this topic, the project intends to undertake the following research:.1..by analyzing the difference of multiple internet data sources to user identification task, with user location information and time information, we proposed to design the spatio-temporal representation features and discriminative models to solve the user identification task in multi-source internet data environment;.2..We proposed to research on internet user profiling technology by integrating semantic analysis, behavior analysis, social relations analysis, time series analysis and spatial trajectory analysis on multi-source internet data;.3..We proposed to research on the internet hidden group detection of specific users based on social network completion and implicit feature extraction. We also study on hidden group profiling technology..This study can provide technical support for the needs of the Internet, such as the user identification of the Internet, the discovery and characterization of the group. It is of great significance for national security and social stability.
研究多源数据中的互联网用户身份对齐,对互联网用户及其社交群体进行刻画分析,具有重要的学术意义和实用价值。针对该主题,本项目拟开展如下研究工作:.1.通过分析多源数据中各类信息对用户身份识别的差异程度,结合用户位置信息和时间信息,设计并建立身份映射特征的时空表示特征及映射模型,解决多源数据环境下用户身份映射问题;.2.研究综合使用多通道互联网数据,融合语义分析、行为分析、社交关系分析、时间序列分析和空间轨迹分析的特定用户画像技术;.3.研究基于社交网络补全、隐式特征抽取的隐式群体发现与刻画技术。.此研究可为互联网用户虚实身份映射、特定用户画像、隐式群体发现与刻画等对于保障网络良好秩序的需求提供技术支撑,对维护国家安全、社会稳定具有重大战略意义。
互联网的虚拟性、匿名性等特点使其成为各类违法犯罪活动的新渠道,对国家安全和社会稳定构成了威胁。在这种背景下,如何基于多源大数据对用户网络身份进行对齐和映射,研究从海量互联网媒体和社交网络数据中分析有效信息,对用户及其社交群体进行刻画分析,对维护国家安全、社会稳定具有重大战略意义。.本课题的研究内容包括两方面:一是研究互联网数据环境下用户身份映射,研究用户身份融合特征设计,研究多通道数据源中同一用户的对齐与映射技术;二是研究用户画像与群体分析,通过将表示学习和深度学习相结合,从用户兴趣、话题发现等角度设计用户刻画特征,研究针对互联网语言风格、互联网数据环境的文本、多媒体语义理解技术,对用户进行全面刻画,提高群体刻画的全面性和准确性。.课题组在用户身份对齐、互联网数据内容分析、用户画像与群体分析等研究方向上取得进展,各项研究工作互相支撑,协同推进课题目标实现。共发表相关论文12篇,其中CCF A类论文6篇,B类论文4篇。课题组在用户对齐、文本和多媒体内容理解等关键技术环节上取得突破,相关成果发表在AAAI、ACM Multimedia等本领域顶级学术会议、及IEEE Transactions on image processing等顶级学术期刊之上,其中发表在PRCV 2020会议上的论文获得最佳论文奖。同时,课题组面向实际应用需要,研究关键算法的工程应用问题,针对可能遇到的工程问题开展研究并取得一定成绩,先后申请相关专利27项,覆盖上述关键算法的工程化、互联网环境应用、大数据应用等领域,为本课题研究成果的实际应用提供了基础。课题组部分研究成果在实际工作中应用后,获得2018年度中国通信学会科技进步一等奖一项,课题负责人入选科技部创新人才推进计划重点领域创新团队。.
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
面向可穿戴设备的多源行为身份认证
基于多模态互联网大数据的用户身份对齐及异常行为分析技术研究
面向互联网信贷的基于多源大数据的个人信用评分关键技术
基于用户表示学习的跨网络用户虚拟身份关联映射研究