As a crucial component of public opinion analysis, opinion mining about hot controversial topics is to obtain relevant opinions by analyzing, inducing and reasoning the subjective comments. Current research on opinion mining has such problems: 1) the limitation of analyzing sources. People prefers to express their opinions in various ways, direct or indirect, in social network. It is inaccurate to mine opinions solely on social network texts or structures; 2) the limitation of mining granularity. Current research mainly focuses on coarse-grained stance analyzing and fine-grained product aspect mining. As opinions about hot controversial topics are in various forms, simple or complex, it is necessary to mine multi-grained opinions. To overcome these problems, this proposal plans to conduct the following studies: 1) We explore the distributed representation of social network text and structure, by making use of the opinion information contained in the multi-information sources, to solve the limitation of analyzing sources; 2) We explore the hierarchical opinion mining approaches based on probabilistic graphical model to address the limitations of mining granularity; 3) We explore the hierarchical opinion mining methods based on distributed representation, by considering both multi-inputs and multi-outputs comprehensively, to eliminate the limitations of source and granularity. Finally, we develop an open, accurate hierarchical opinion mining system which could provide theoretical supports for subsequent opinion cluster detection and public opinion analysis.
作为舆情分析的重要组成部分,面向热门争议话题的观点挖掘是围绕热门争议话题,对主观性文本进行分析、归纳和推理,获取观点的过程。当前的观点挖掘存在以下问题:1)来源的局限性:社交网络中用户表达观点的方式多种多样。单独基于社交网络文本或结构进行观点挖掘都有其局限性;2)粒度的局限性:当前研究主要集中在粗粒度立场分析和细粒度产品属性挖掘,缺乏多粒度观点挖掘。针对上述问题,本项目拟开展以下研究工作:1)研究基于社交网络文本与结构的分布式表示,充分利用多信息源包含的观点信息,解决来源的局限性;2)研究基于概率图模型的层次观点挖掘,既识别出用户立场,又挖掘出其背后的深层次原因,解决挖掘粒度的局限性;3)研究基于分布式表示的层次观点挖掘,综合考虑多信息输入和多粒度输出,有效解决来源和粒度的局限性。进而在此基础上实现一个开放、准确的层次观点挖掘系统,为后续的意见群体检测、舆情分析提供理论支撑。
作为舆情分析的重要组成部分,面向热门争议话题的层次观点挖掘是围绕热门争议话题,对主观性文本进行分析、归纳和推理,获取观点的过程。它为后续的意见群体检测、舆情分析提供支撑。项目的主要研究内容包括:(1)面向热门争议话题的基于网络文本的层次观点挖掘;(2)面向热门争议话题的基于文本和结构的情感分析和观点挖掘。在此基础上,实现一个面向热门争议话题的开放、准确的层次观点挖掘系统。项目按照研究计划顺利完成。共发表与本项目相关的学术论文30篇,其中SCI论文11篇,包括Information Processing & Management (IPM)等知名期刊,CCF A类会议论文7篇,包括ACL2020、ACL2021、IJCAI 2019、AAAI2021等国际高水平会议,CCF B类会议论文7篇,包括EMNLP2018、EMNLP2019、EMNLP2020、EMNLP2021等国际知名会议。具有代表性的主要研究成果包括:(1)围绕层次观点挖掘展开研究,克服传统方法依赖训练语料的标注质量和数量这一限制,提出了一个基于概率图模型的层次观点挖掘模型。这是首次提出的面向层次观点挖掘的贝叶斯模型。方法目前被应用在金融相关文本,取得了不错的效果。这为方法在其他垂直领域的成功应用提供了参考。(2)围绕面向文本和结构的观点挖掘展开研究,提出了一系列观点挖掘和情感分析方法。首先考虑到在社交媒体中,用户表达观点的方式并不局限于文本,大多数用户同时使用关注、点赞、评论和转发表达他们的观点,提出了动态观点神经网络模型。在此基础上将用户的行为习惯建模为temporal point process,进而提出了一个新的模型。其次,考虑到情绪往往与某个隐含主题的相关联,我们将相关情绪排序与主题模型相结合,引入了结合主题信息的可解释神经网络,用于相关情绪排序。相关工作为社交媒体分析提供了新的思路和手段。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
中文社交化短文本情感分析与话题挖掘研究
融合网络特征的文本观点挖掘
基于文本观点挖掘的多对象评级理论与方法研究
面向微博平台的短文本话题检测与跟踪研究