面向用户评论的论辩挖掘方法研究

基本信息
批准号:61602453
项目类别:青年科学基金项目
资助金额:21.00
负责人:高扬
学科分类:
依托单位:中国科学院软件研究所
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:Francesca Toni,苏冰,李则婷,付培国,赵鑫玮,段学煜,王艺博
关键词:
论辩挖掘计算论辩学强化学习结构化数据Web信息抽取
结项摘要

Users’ reviews include not only users’ opinions and sentiment polarities, but also include another kind of useful information: the semantic logic relations between sentences. As an extension of traditional text mining and sentiment analysis techniques, Argumentation Mining (AM) attempts to extract finer-grained information from users’ reviews, including users’ claims, reasons and inference relations between sentences. AM attracts considerable research attention in recent years, but as a research area in its infancy, AM work currently faces two major problems: i) there exist few well-annotated argumentation corpora, especially for users’ reviews, because the current argumentation annotation methods are expensive, time-consuming and unstable in quality; ii) current AM techniques perform poorly in identifying arguments from texts, as they do not consider the sequential and semantic logic relations between sentences during the identification process. Having its root in Argumentation Theory, this project performs theoretic analysis and develops technical methods for AM; in particular, this project i) develops a Crowdsourcing-based argumentation annotation framework, ii) models the AM process as a Markov Decision Process (MDP), and iii) proposes efficient Reinforcement Learning algorithms to solve this MDP. This project will promote the development of AM in China, and its proposed methods can be applied in public opinion monitoring, recommendation systems and other applications.

用户评论不仅包含用户主观意见和情感倾向,而且其语句间蕴含着潜在语义逻辑关系。论辩挖掘扩展传统的文本挖掘和情感分析技术,致力于挖掘文本中的论辩结构,包括观点、论据、论证逻辑关系等,近年来逐渐受到学术界关注。然而,论辩挖掘尚处于起步阶段,有如下两个迫切需要解决的问题:1.现有的论辩标注方法成本高、速度慢、质量不稳定,导致论辩标注语料库尤其是针对用户评论的论辩标注语料库的严重匮乏;2.现有的论辩挖掘方法没有考虑句子间的顺序以及语义逻辑关系,因而无法有效挖掘出文本中的论辩结构。本项目以论辩理论为基础,将系统地研究论辩挖掘的理论和方法:1.基于众包技术的论辩标注方法;2.基于马尔可夫决策过程(MDP)的论辩挖掘模型;3.基于强化学习的MDP求解算法。在理论研究的基础上,本项目将实现一个原型系统并实例验证分析。本项目将推动这个崭新的研究分支在我国的发展,将会在舆情分析、智能推荐等应用领域发挥重要作用。

项目摘要

论辩是指用某些理由去支持或反驳某个观点的过程或语言形式。用户评论中广泛存在论辩结构。本项目研究如何从用户评论中自动抽取出语句间的论辩关系,从而更加细粒度地理解用户的意见及其原因。本项目从如下三个方面对论辩挖掘问题进行研究:(i)基于度量学习的语句语义相关度衡量,(ii)基于深度学习和强化学习的论辩挖掘方法研究,(iii)基于论辩推理的决策支持系统研究。..本项目已按照研究计划顺利完成,达到预期研究目标。在研究内容(i)中,我们分别建立了基于信息增益和相关熵的度量学习目标构建理论,验证了其相对于传统经验式学习目标在计算效率和抵抗噪声上的优势,并提出了高效的非线性度量学习方法。在研究内容(ii)中,我们提出了基于深度学习的论辩边缘检测算法,以及基于强化学习的论辩体分类算法。在研究内容(iii)中,我们提出了概率论辩推理框架,并提出了基于蒙特卡罗采样的快速求解算法。同时,为验证论辩挖掘方法的有效性,我们研究了利用基于论辩体数量、结构、关系的组合特征,来对用户评论的质量进行评分。..在数据方面,本项目构建并公开了一个中文论辩数据集和一个英文论辩数据集。本项目中提出的基于信息论的度量学习方法和概率论辩推理框架具有较强的普适性和通用性,可以广泛应用在推荐系统、文本挖掘、决策支持等系统中,具有较强的科学价值的和广泛的应用前景。..本项目产出8篇高水平论文,其中高影响因子SCI期刊论文4篇,CCF/Core B类以上会议论文4篇。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
2

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

DOI:10.11842/wst.20190724002
发表时间:2020
3

结直肠癌免疫治疗的多模态影像及分子影像评估

结直肠癌免疫治疗的多模态影像及分子影像评估

DOI:10.13609/j.cnki.1000-0313.2022.04.019
发表时间:2022
4

智能煤矿建设路线与工程实践

智能煤矿建设路线与工程实践

DOI:10.13199/j.cnki.cst.2020.07.010
发表时间:2020
5

信息熵-保真度联合度量函数的单幅图像去雾方法

信息熵-保真度联合度量函数的单幅图像去雾方法

DOI:10.3724/SP.J.1089.2019.17435
发表时间:2019

高扬的其他基金

批准号:51206088
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:61405056
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:31200404
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目
批准号:61602036
批准年份:2016
资助金额:21.00
项目类别:青年科学基金项目
批准号:30371313
批准年份:2003
资助金额:7.00
项目类别:面上项目
批准号:30540069
批准年份:2005
资助金额:8.00
项目类别:专项基金项目
批准号:81373226
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:61603010
批准年份:2016
资助金额:19.00
项目类别:青年科学基金项目
批准号:31500340
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:30771987
批准年份:2007
资助金额:28.00
项目类别:面上项目
批准号:61503043
批准年份:2015
资助金额:22.00
项目类别:青年科学基金项目
批准号:31570465
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:81072489
批准年份:2010
资助金额:31.00
项目类别:面上项目
批准号:10603005
批准年份:2006
资助金额:36.00
项目类别:青年科学基金项目
批准号:51605379
批准年份:2016
资助金额:22.00
项目类别:青年科学基金项目
批准号:11372311
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:11702212
批准年份:2017
资助金额:21.00
项目类别:青年科学基金项目
批准号:41871080
批准年份:2018
资助金额:60.00
项目类别:面上项目

相似国自然基金

1

面向中文网络评论的产品特征挖掘方法研究

批准号:71001023
批准年份:2010
负责人:李实
学科分类:G0112
资助金额:16.10
项目类别:青年科学基金项目
2

结合领域知识的端到端论辩挖掘方法研究

批准号:61702106
批准年份:2017
负责人:魏忠钰
学科分类:F0211
资助金额:26.00
项目类别:青年科学基金项目
3

面向大型社会网络融合的关联用户挖掘模型与方法

批准号:71601013
批准年份:2016
负责人:周小平
学科分类:G0112
资助金额:17.00
项目类别:青年科学基金项目
4

用户评论上细粒度话题情感分析方法研究

批准号:61702391
批准年份:2017
负责人:徐悦甡
学科分类:F06
资助金额:24.00
项目类别:青年科学基金项目