Users’ reviews include not only users’ opinions and sentiment polarities, but also include another kind of useful information: the semantic logic relations between sentences. As an extension of traditional text mining and sentiment analysis techniques, Argumentation Mining (AM) attempts to extract finer-grained information from users’ reviews, including users’ claims, reasons and inference relations between sentences. AM attracts considerable research attention in recent years, but as a research area in its infancy, AM work currently faces two major problems: i) there exist few well-annotated argumentation corpora, especially for users’ reviews, because the current argumentation annotation methods are expensive, time-consuming and unstable in quality; ii) current AM techniques perform poorly in identifying arguments from texts, as they do not consider the sequential and semantic logic relations between sentences during the identification process. Having its root in Argumentation Theory, this project performs theoretic analysis and develops technical methods for AM; in particular, this project i) develops a Crowdsourcing-based argumentation annotation framework, ii) models the AM process as a Markov Decision Process (MDP), and iii) proposes efficient Reinforcement Learning algorithms to solve this MDP. This project will promote the development of AM in China, and its proposed methods can be applied in public opinion monitoring, recommendation systems and other applications.
用户评论不仅包含用户主观意见和情感倾向,而且其语句间蕴含着潜在语义逻辑关系。论辩挖掘扩展传统的文本挖掘和情感分析技术,致力于挖掘文本中的论辩结构,包括观点、论据、论证逻辑关系等,近年来逐渐受到学术界关注。然而,论辩挖掘尚处于起步阶段,有如下两个迫切需要解决的问题:1.现有的论辩标注方法成本高、速度慢、质量不稳定,导致论辩标注语料库尤其是针对用户评论的论辩标注语料库的严重匮乏;2.现有的论辩挖掘方法没有考虑句子间的顺序以及语义逻辑关系,因而无法有效挖掘出文本中的论辩结构。本项目以论辩理论为基础,将系统地研究论辩挖掘的理论和方法:1.基于众包技术的论辩标注方法;2.基于马尔可夫决策过程(MDP)的论辩挖掘模型;3.基于强化学习的MDP求解算法。在理论研究的基础上,本项目将实现一个原型系统并实例验证分析。本项目将推动这个崭新的研究分支在我国的发展,将会在舆情分析、智能推荐等应用领域发挥重要作用。
论辩是指用某些理由去支持或反驳某个观点的过程或语言形式。用户评论中广泛存在论辩结构。本项目研究如何从用户评论中自动抽取出语句间的论辩关系,从而更加细粒度地理解用户的意见及其原因。本项目从如下三个方面对论辩挖掘问题进行研究:(i)基于度量学习的语句语义相关度衡量,(ii)基于深度学习和强化学习的论辩挖掘方法研究,(iii)基于论辩推理的决策支持系统研究。..本项目已按照研究计划顺利完成,达到预期研究目标。在研究内容(i)中,我们分别建立了基于信息增益和相关熵的度量学习目标构建理论,验证了其相对于传统经验式学习目标在计算效率和抵抗噪声上的优势,并提出了高效的非线性度量学习方法。在研究内容(ii)中,我们提出了基于深度学习的论辩边缘检测算法,以及基于强化学习的论辩体分类算法。在研究内容(iii)中,我们提出了概率论辩推理框架,并提出了基于蒙特卡罗采样的快速求解算法。同时,为验证论辩挖掘方法的有效性,我们研究了利用基于论辩体数量、结构、关系的组合特征,来对用户评论的质量进行评分。..在数据方面,本项目构建并公开了一个中文论辩数据集和一个英文论辩数据集。本项目中提出的基于信息论的度量学习方法和概率论辩推理框架具有较强的普适性和通用性,可以广泛应用在推荐系统、文本挖掘、决策支持等系统中,具有较强的科学价值的和广泛的应用前景。..本项目产出8篇高水平论文,其中高影响因子SCI期刊论文4篇,CCF/Core B类以上会议论文4篇。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
结直肠癌免疫治疗的多模态影像及分子影像评估
智能煤矿建设路线与工程实践
信息熵-保真度联合度量函数的单幅图像去雾方法
面向中文网络评论的产品特征挖掘方法研究
结合领域知识的端到端论辩挖掘方法研究
面向大型社会网络融合的关联用户挖掘模型与方法
用户评论上细粒度话题情感分析方法研究