In Web2.0 era, various Social Medias are constantly emerging, which has profound influence not only to our lifestyle, but also to the way we work and communicate with each other. The information spread in Social Medias is primarily driven by the user's communication behavior, which make the User Generated Contents (UGC) usually are short and noisy, the dataset is at a tremendously scale, and the topics are rapid diffused and evolved in social medias.These features bring some new chanllenges for information diffusion analysis. Based on the characteristics of Social Medias, this project focuses on issues related to social network analysis and information diffusion analyis. More specifically, the project targeted to answer three main questions. That is, how to model the semantic of user generated contents, how to detect and track the topics in large-scale nosiy data of social media , and how to characterize the information diffusion in social media. The goal of this project contains three research emphases: the appropriate representation model and semantic similarity measure for short and noise user-generated contents, the social media oriented topic detection and tracking method, and the inforamtion diffusion analysis based on the social network analysis. We are expecting to archive these goals through the following methods:leveraging the external knowledge to enhance the semantic representation of short and noise Web2.0 data, incorporating the social features with the semantic features to detect the hot topics, tracking and analyzing the information diffusion based on the social network analysis technologies. Through the studies in this project, some novel methods for information diffusion mining will be proposed, and some influencing factors of infromation diffusion in social medias will be discovered. The project is academically valuable and will support the further data mining researches on Internet.
Web2.0时代,新型社会媒体不断涌现,深刻地改变了人们信息交流的方式。社会媒体中的信息传播主要由用户的社会交往行为驱动,呈现出文本质量参差不齐、数据规模迅速增长、热点信息快速扩散、信息内容动态演化等新特征,为科学研究和实际应用带来了新的挑战。本项目将通过有机结合社会网络分析和信息传播分析,从面向用户生成内容的语义表示和相似度计算方法、面向社会媒体的热点信息挖掘方法、基于社会网络的信息传播分析方法等三个方面开展研究,拟提出结合外部语义资源的文本表示模型、融合语义相关性和社会特征的热点话题发现方法、结合社会网络分析的信息传播跟踪与分析方法,力求在网络文本语义特征建模、大规模社会媒体数据中的热点信息发现、社会网络与信息传播的相互作用等关键科学问题的研究中获得进展和突破。本项目将形成面向社会媒体进行信息传播挖掘与分析的一系列方法和关键技术,为深化互联网信息的挖掘与分析提供支持。
社会媒体的出现深刻地改变了人们信息交流的方式,对社会媒体上的信息传播进行研究具有重要的理论意义和应用价值。本项目根据社会媒体的信息传播特点,针对社交媒体中的热点信息挖掘与传播分析等关键问题进行研究。.通过分析社会媒体用户生成内容的结构特征和文本特征,提出了结合社会网络信息的热点话题命名实体识别方法,基于HashTag等社会媒体特征的热点话题发现方法,并分析了热点话题在社会网络上的传播特点,发现社交媒体中信息传播在社会网络空间上存在洋流现象,受到社会网络结构和用户行为的影响较大。在此基础上,本项目从社会网络结构和用户倾向性两个方面对信息传播的影响进行了分析。在网络结构对信息传播的影响分析方面,提出了基于社会网络链接结构和历史信息预测新话题传播的方法;然后,我们通过从社会网络结构和用户行为两个维度综合建模,提出了一种发现高质量热点话题的方法。在用户倾向性对信息传播的影响分析方面,研究了如何从社交媒体中查找可能被转发的话题以及话题转发者的问题;并在分析挖掘用户倾向性的基础上,研究了基于用户倾向性对信息传播进行预测和分析的方法。.本项目结合社会网络特征进行话题传播分析研究,提出了热点话题发现方法、基于社会网络结构的信息传播分析方法和基于用户倾向性的信息传播行为预测方法,为进一步深化面向社交媒体的内容分析提供支持。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
黄河流域水资源利用时空演变特征及驱动要素
硬件木马:关键问题研究进展及新动向
中国参与全球价值链的环境效应分析
在线社会网络中信息传播规律及网络干预研究
面向社会网络信息传播的网络重构关键技术研究
面向社会信息网络的社区分析研究
面向信息传播理解的社会网络图摘要方法研究