面向热门争议话题的基于社交网络文本与结构的层次观点挖掘研究

基本信息
批准号:61772132
项目类别:面上项目
资助金额:65.00
负责人:周德宇
学科分类:
依托单位:东南大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:何瑜岚,王睿,张致恺,缪磊,朱力行,郭林森,杨扬
关键词:
情感分析观点挖掘社交网络信息抽取概率图模型
结项摘要

As a crucial component of public opinion analysis, opinion mining about hot controversial topics is to obtain relevant opinions by analyzing, inducing and reasoning the subjective comments. Current research on opinion mining has such problems: 1) the limitation of analyzing sources. People prefers to express their opinions in various ways, direct or indirect, in social network. It is inaccurate to mine opinions solely on social network texts or structures; 2) the limitation of mining granularity. Current research mainly focuses on coarse-grained stance analyzing and fine-grained product aspect mining. As opinions about hot controversial topics are in various forms, simple or complex, it is necessary to mine multi-grained opinions. To overcome these problems, this proposal plans to conduct the following studies: 1) We explore the distributed representation of social network text and structure, by making use of the opinion information contained in the multi-information sources, to solve the limitation of analyzing sources; 2) We explore the hierarchical opinion mining approaches based on probabilistic graphical model to address the limitations of mining granularity; 3) We explore the hierarchical opinion mining methods based on distributed representation, by considering both multi-inputs and multi-outputs comprehensively, to eliminate the limitations of source and granularity. Finally, we develop an open, accurate hierarchical opinion mining system which could provide theoretical supports for subsequent opinion cluster detection and public opinion analysis.

作为舆情分析的重要组成部分,面向热门争议话题的观点挖掘是围绕热门争议话题,对主观性文本进行分析、归纳和推理,获取观点的过程。当前的观点挖掘存在以下问题:1)来源的局限性:社交网络中用户表达观点的方式多种多样。单独基于社交网络文本或结构进行观点挖掘都有其局限性;2)粒度的局限性:当前研究主要集中在粗粒度立场分析和细粒度产品属性挖掘,缺乏多粒度观点挖掘。针对上述问题,本项目拟开展以下研究工作:1)研究基于社交网络文本与结构的分布式表示,充分利用多信息源包含的观点信息,解决来源的局限性;2)研究基于概率图模型的层次观点挖掘,既识别出用户立场,又挖掘出其背后的深层次原因,解决挖掘粒度的局限性;3)研究基于分布式表示的层次观点挖掘,综合考虑多信息输入和多粒度输出,有效解决来源和粒度的局限性。进而在此基础上实现一个开放、准确的层次观点挖掘系统,为后续的意见群体检测、舆情分析提供理论支撑。

项目摘要

作为舆情分析的重要组成部分,面向热门争议话题的层次观点挖掘是围绕热门争议话题,对主观性文本进行分析、归纳和推理,获取观点的过程。它为后续的意见群体检测、舆情分析提供支撑。项目的主要研究内容包括:(1)面向热门争议话题的基于网络文本的层次观点挖掘;(2)面向热门争议话题的基于文本和结构的情感分析和观点挖掘。在此基础上,实现一个面向热门争议话题的开放、准确的层次观点挖掘系统。项目按照研究计划顺利完成。共发表与本项目相关的学术论文30篇,其中SCI论文11篇,包括Information Processing & Management (IPM)等知名期刊,CCF A类会议论文7篇,包括ACL2020、ACL2021、IJCAI 2019、AAAI2021等国际高水平会议,CCF B类会议论文7篇,包括EMNLP2018、EMNLP2019、EMNLP2020、EMNLP2021等国际知名会议。具有代表性的主要研究成果包括:(1)围绕层次观点挖掘展开研究,克服传统方法依赖训练语料的标注质量和数量这一限制,提出了一个基于概率图模型的层次观点挖掘模型。这是首次提出的面向层次观点挖掘的贝叶斯模型。方法目前被应用在金融相关文本,取得了不错的效果。这为方法在其他垂直领域的成功应用提供了参考。(2)围绕面向文本和结构的观点挖掘展开研究,提出了一系列观点挖掘和情感分析方法。首先考虑到在社交媒体中,用户表达观点的方式并不局限于文本,大多数用户同时使用关注、点赞、评论和转发表达他们的观点,提出了动态观点神经网络模型。在此基础上将用户的行为习惯建模为temporal point process,进而提出了一个新的模型。其次,考虑到情绪往往与某个隐含主题的相关联,我们将相关情绪排序与主题模型相结合,引入了结合主题信息的可解释神经网络,用于相关情绪排序。相关工作为社交媒体分析提供了新的思路和手段。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

玉米叶向值的全基因组关联分析

玉米叶向值的全基因组关联分析

DOI:
发表时间:
2

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
3

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
4

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
5

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018

周德宇的其他基金

批准号:61103077
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目

相似国自然基金

1

中文社交化短文本情感分析与话题挖掘研究

批准号:71501003
批准年份:2015
负责人:王德庆
学科分类:G0112
资助金额:17.40
项目类别:青年科学基金项目
2

融合网络特征的文本观点挖掘

批准号:61170156
批准年份:2011
负责人:王挺
学科分类:F0211
资助金额:56.00
项目类别:面上项目
3

基于文本观点挖掘的多对象评级理论与方法研究

批准号:61175067
批准年份:2011
负责人:王素格
学科分类:F03
资助金额:60.00
项目类别:面上项目
4

面向微博平台的短文本话题检测与跟踪研究

批准号:61303115
批准年份:2013
负责人:李飞
学科分类:F0211
资助金额:23.00
项目类别:青年科学基金项目