社交网络级联数据流异常检测模型研究

基本信息
批准号:61502479
项目类别:青年科学基金项目
资助金额:20.00
负责人:周川
学科分类:
依托单位:中国科学院信息工程研究所
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:乔治,王鹏,臧文羽,高礼,卢伟雪,姚启鹏,冯伟伟,路遥,马云龙
关键词:
图粗化算法级联数据异常检测概率图模型图特征提取与分类
结项摘要

Social network cascade data is the propagation trajectory data to describe the information propagation in social networks. Cascade data anomaly detection aims to detect abnormal information propagation path (e.g. bursty propagation path). Different from the traditional detection method based on vector data, cascade data is graph data, and the traditional detection model can not be used directly. To this end, this project will address the new problem of cascade data anomaly detection. From the issues of feature extraction, anomaly detection model and fast algorithm, we will carry out the following researches: 1) feature extraction method based on the cascaded data content and the structure of diffusion; 2) anomaly detection model with classification and clustering; 3) cascade data coarsen and fast algorithm for large-scale network. The research results of this project have important theoretical value and application prospect in the fields of social network analysis, such as public opinion on social networks and commercial advertising pattern discovery.

社交网络级联数据(Cascade data)是社交网络中信息传播所留下的传播轨迹数据,级联数据异常检测旨在检测出异常的信息传播轨迹(比如爆发性的传播轨迹)。与传统基于向量数据的检测方法不同,级联数据属于图数据(Graph data)类型,因此传统的向量数据检测模型都不能直接使用在级联数据上。为此,本项目将针对社交网络级联数据异常检测这个新问题,从级联数据的特征抽取,级联数据的异常检测模型,以及大规模传播级联数据的快速求解算法这三个问题出发,具体开展以下研究内容:1)级联数据基于传播子图结构(Subgraphs)的特征抽取方法;2)级联数据基于时序概率图模型的聚类异常检测模型;3)大规模级联数据基于粗化的快速求解算法。 本项目的研究成果对社交网络商业广告异常传播模式发现、 社交网络舆情分析等领域具有重要的理论价值和应用前景。

项目摘要

在基金支持下,项目组按照项目计划书中的研究任务开展了研究工作,完成了既定的研究目标。此外,还在实际工作中对原计划的研究内容进行了更深层次的拓展。过去三年中,发表论文22篇,其中SCI期刊4篇,CCF-A类6篇,CCF-B类5篇,获得2017年神经网络国际联合大会(IJCNN-17)最佳学生论文奖,受理专利2项。.项目组以社交网络级联数据流为研究对象,从级联数据特征提取、异常检测模型、大规模级联数据快速求解这三个问题出发,开展了一系列研究工作,主要进展包括:1)首次提出最小差分预解集问题,突破级联信息的被动采集局限,解决了级联传播源头的主动推断问题;2)利用图的效用等价刻画,提出了一种半数据驱动的网络粗化方法,将大规模级联数据的挖掘效率提高2个数量级以上;3)提出了用户偏好与对象话题的联动演化分析模型,用户参与级联传播的预测精度提高3个百分点;4)提出了面向时序文本数据流的动态演化模型,揭示了话题演化规律和外在影响因素的作用机理,将时序文本数据流的建模困惑度降低10%以上;5)提出了基于深度结构学习的群组异常检测方法,该方法通过引入多隐层自编码器对二部图网络进行特征提取,不仅能突破低密度稠密块所带来的挑战,还能对异常群组的数量进行自适应识别。以上研究成果进一步应用在中科院战略先导专项和973等重大项目中。. 在基金支持下,项目负责人先后带队参加IJCAI和ICDM等主流国际会议。项目负责人多次担任AAAI、IJCAI、SDM等国际会议的程序委员会委员,担任期刊IEEE Access(IF:2.257)副主编和期刊Complexity(IF:3.059)客座编辑,是IEEE TKDE、ACM TKDD等国内外有影响学术期刊的审稿人。担任中国计算机学会(CCF)高级会员、中国中文信息学会(CIPS)青年工作委员会委员和社会媒体处理专委会通讯委员。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

论大数据环境对情报学发展的影响

论大数据环境对情报学发展的影响

DOI:
发表时间:2017
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018
4

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

周川的其他基金

批准号:61872360
批准年份:2018
资助金额:65.00
项目类别:面上项目

相似国自然基金

1

基于隐私保护的分布式数据流异常检测模型融合研究

批准号:60973120
批准年份:2009
负责人:傅彦
学科分类:F0206
资助金额:30.00
项目类别:面上项目
2

基于分形理论与小波分析的网络数据流异常检测研究

批准号:61073188
批准年份:2010
负责人:任勋益
学科分类:F0205
资助金额:30.00
项目类别:面上项目
3

基于神经拟态模型的并发数据流无监督在线异常检测技术

批准号:61603119
批准年份:2016
负责人:方启明
学科分类:F0609
资助金额:21.00
项目类别:青年科学基金项目
4

基于异质信息网络表征学习的社交媒体事件异常检测

批准号:61872287
批准年份:2018
负责人:罗敏楠
学科分类:F0211
资助金额:65.00
项目类别:面上项目