Social media,consisting of microblogging, media sharing platforms and so on, are rapidly becoming the important information source for people to access real-time information. However, there is great difference between the information in social media and in traditional web sites in terms of the information formats, the ways of propagation and quality of information. Therefore new theoretical models and algorithms are urgently needed. Since social network models can be used to describe various kinds of relationships between users and users, documents and documents, images and images as well as users and documents in social media, in this application project we want to study the social media information processing oriented social networks and their applications under the application backgrounds of multi-document summarization and image annotation. The research refer to following issues: the features of the dynamic evolution of social networks; the influence of the users in the social networks and the relation with the qualities of the message sent by the users; new similarity measure on two objects in heterogeneous social networks based on the different kinds of relation compositions and the attributes of users, and how to apply the similarity computation to discover different network societies and annotate images automatically; exploring novel dynamic topic models for the analysis of the message flow consisting of short message in the conversation form, and then using the results and the aforementioned message quality computation to improve the results of multi-document summarization. The research project arms at exploring new social network models from the viewpoints of social media information processing, and then utilizing the new social models to develop the theory and techniques for more applications in social media information processing.
以微博和共享媒体等组成的社会媒体正日益成为人们获取实时信息的重要来源。但社会媒体上的信息格式、传播方式和信息质量都和传统的静态网页有很多不同,急需新的理论模型和算法。由于社会网络模型可以很好地表示用户之间、文档之间、图像之间、和用户与文档之间各种不同关系,本课题将以社会媒体文本摘要和图像标注为应用背景,研究面向社会媒体信息处理的社会网络模型以及应用。具体包括研究社会网络的动态拓扑进化特性、网络节点的影响力计算及与节点所发送信息质量的关系;如何利用异质社会网络中的不同性质关系合成和节点属性来计算异质网络中的对象相似度,并应用到社区发现和图像标注;研究能反映网络社区中会话型信息流的动态主题模型,并研究如何利用该模型和网络信息质量计算的结果,改善对数据流形式的文本摘要。该研究的目标是基于社会媒体信息处理的视角,探索新型社会网络,并应用到更多的社会媒体信息处理应用中。
我们按课题申请书的研究内容开展了研究,取得下面的研究成果:1)我们基于模糊数学和图论理论,给出了对社会网络中用户关系以及共享知识图谱中的对象关系的新表示方法。新表示方法使得关系的取值是介于区间[0..1]上的实数,而且,用户和实体之间可以有多种关系。我们利用这种表示方法,设计或改进了对影视节目的推荐算法和在社会网络中对朋友推荐算法。就推荐系统自身研究,我们改进了两类推荐算法,即基于评分的和基于排序的推荐算法。除此之外,我们还对基于排序的推荐算法给出了并行和分布式的实现方法。上述理论成果部分地应用到对智能电视的节目推荐系统的设计与实现中;2)我们提出了多种新型的主题模型,其特点是考虑了时间和空间因素。我们应用这些主题模型去设计对社会媒体的多种应用算法,其中包括对用户的多种具有语义特征的划分方法、评估论坛和社会媒体中帖子的质量、进行对社会媒体的文本进行数据挖掘和对推特与微博进行自动摘要。3)我们给出采用多目标优化函数的图像标注算法,不同于传统独立地选择标注词,新算法即考虑多目标函数的取值,也考虑已经选择的标注词的语义的冗余性,避免选择与已经选取标注词在语义上相同或相近。实验表明,采用新算法得到的图像标注,在检索的准确性和输出的多样性上优于已知算法。除此之外,我们也研究了基于图像的文本标注对图像的语义分割问题,给出了如何建立标注词所表示对象在图像中可能位置的映射;4)我们给出了社会网络中的节点影响力分析新算法、增量算法和当计算选出种子节点不可用时的新节点选择算法。给出了具有较大概率的可能被广泛传播的推特和微博预测模型。.共发表各类论文超过50篇,其中,期刊论文19篇,会议论文32篇。其中列入中国计算机学会(CCF)推荐期刊和会议的有 A类7篇, B类6篇以及C类23篇。我们已经建立了和国际一些顶级实验室的合作研究关系。有6位博士和20位硕士生在获得学位的研究中得到在本项目的资助。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
黄河流域水资源利用时空演变特征及驱动要素
内点最大化与冗余点控制的小型无人机遥感图像配准
中国参与全球价值链的环境效应分析
基于社会媒体信息挖掘的图像标注技术研究
基于跨媒体数据挖掘的社会图像事件分析与标注
融合多模态文本关联分析与挖掘的跨媒体社会图像检索方法研究
基于社会化短文本主题模型的社会网络用户心理健康分析