面向用户评论的论辩挖掘方法研究

基本信息

批准号：61602453

项目类别：青年科学基金项目

资助金额：21.00

负责人：高扬

学科分类：

依托单位：中国科学院软件研究所

批准年份：2016

结题年份：2019

起止时间：2017-01-01 - 2019-12-31

项目状态：已结题

项目参与者：Francesca Toni,苏冰,李则婷,付培国,赵鑫玮,段学煜,王艺博

关键词：

论辩挖掘计算论辩学强化学习结构化数据Web信息抽取

结项摘要

Users’ reviews include not only users’ opinions and sentiment polarities, but also include another kind of useful information: the semantic logic relations between sentences. As an extension of traditional text mining and sentiment analysis techniques, Argumentation Mining (AM) attempts to extract finer-grained information from users’ reviews, including users’ claims, reasons and inference relations between sentences. AM attracts considerable research attention in recent years, but as a research area in its infancy, AM work currently faces two major problems: i) there exist few well-annotated argumentation corpora, especially for users’ reviews, because the current argumentation annotation methods are expensive, time-consuming and unstable in quality; ii) current AM techniques perform poorly in identifying arguments from texts, as they do not consider the sequential and semantic logic relations between sentences during the identification process. Having its root in Argumentation Theory, this project performs theoretic analysis and develops technical methods for AM; in particular, this project i) develops a Crowdsourcing-based argumentation annotation framework, ii) models the AM process as a Markov Decision Process (MDP), and iii) proposes efficient Reinforcement Learning algorithms to solve this MDP. This project will promote the development of AM in China, and its proposed methods can be applied in public opinion monitoring, recommendation systems and other applications.

用户评论不仅包含用户主观意见和情感倾向，而且其语句间蕴含着潜在语义逻辑关系。论辩挖掘扩展传统的文本挖掘和情感分析技术，致力于挖掘文本中的论辩结构，包括观点、论据、论证逻辑关系等，近年来逐渐受到学术界关注。然而，论辩挖掘尚处于起步阶段，有如下两个迫切需要解决的问题：1.现有的论辩标注方法成本高、速度慢、质量不稳定，导致论辩标注语料库尤其是针对用户评论的论辩标注语料库的严重匮乏；2.现有的论辩挖掘方法没有考虑句子间的顺序以及语义逻辑关系，因而无法有效挖掘出文本中的论辩结构。本项目以论辩理论为基础，将系统地研究论辩挖掘的理论和方法：1.基于众包技术的论辩标注方法；2.基于马尔可夫决策过程（MDP）的论辩挖掘模型；3.基于强化学习的MDP求解算法。在理论研究的基础上，本项目将实现一个原型系统并实例验证分析。本项目将推动这个崭新的研究分支在我国的发展，将会在舆情分析、智能推荐等应用领域发挥重要作用。

项目摘要

论辩是指用某些理由去支持或反驳某个观点的过程或语言形式。用户评论中广泛存在论辩结构。本项目研究如何从用户评论中自动抽取出语句间的论辩关系，从而更加细粒度地理解用户的意见及其原因。本项目从如下三个方面对论辩挖掘问题进行研究：（i）基于度量学习的语句语义相关度衡量，（ii）基于深度学习和强化学习的论辩挖掘方法研究，（iii）基于论辩推理的决策支持系统研究。..本项目已按照研究计划顺利完成，达到预期研究目标。在研究内容（i）中，我们分别建立了基于信息增益和相关熵的度量学习目标构建理论，验证了其相对于传统经验式学习目标在计算效率和抵抗噪声上的优势，并提出了高效的非线性度量学习方法。在研究内容（ii）中，我们提出了基于深度学习的论辩边缘检测算法，以及基于强化学习的论辩体分类算法。在研究内容（iii）中，我们提出了概率论辩推理框架，并提出了基于蒙特卡罗采样的快速求解算法。同时，为验证论辩挖掘方法的有效性，我们研究了利用基于论辩体数量、结构、关系的组合特征，来对用户评论的质量进行评分。..在数据方面，本项目构建并公开了一个中文论辩数据集和一个英文论辩数据集。本项目中提出的基于信息论的度量学习方法和概率论辩推理框架具有较强的普适性和通用性，可以广泛应用在推荐系统、文本挖掘、决策支持等系统中，具有较强的科学价值的和广泛的应用前景。..本项目产出8篇高水平论文，其中高影响因子SCI期刊论文4篇，CCF/Core B类以上会议论文4篇。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.13609/j.cnki.1000-0313.2022.04.019

发表时间：2022

DOI：10.13199/j.cnki.cst.2020.07.010

发表时间：2020

DOI：10.3724/SP.J.1089.2019.17435

发表时间：2019

高扬的其他基金

批准号：51206088

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：61405056

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：31200404

批准年份：2012

资助金额：24.00

项目类别：青年科学基金项目

批准号：61602036

批准年份：2016

资助金额：21.00

项目类别：青年科学基金项目

批准号：30371313

批准年份：2003

资助金额：7.00

项目类别：面上项目

批准号：30540069

批准年份：2005

资助金额：8.00

项目类别：专项基金项目

批准号：81373226

批准年份：2013

资助金额：80.00

项目类别：面上项目

批准号：61603010

批准年份：2016

资助金额：19.00

项目类别：青年科学基金项目

批准号：31500340

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：30771987

批准年份：2007

资助金额：28.00

项目类别：面上项目

批准号：61503043

批准年份：2015

资助金额：22.00

项目类别：青年科学基金项目

批准号：31570465

批准年份：2015

资助金额：63.00

项目类别：面上项目

批准号：81072489

批准年份：2010

资助金额：31.00

项目类别：面上项目

批准号：10603005

批准年份：2006

资助金额：36.00

项目类别：青年科学基金项目

批准号：51605379

批准年份：2016

资助金额：22.00

项目类别：青年科学基金项目

批准号：11372311

批准年份：2013

资助金额：80.00

项目类别：面上项目

批准号：11702212

批准年份：2017

资助金额：21.00

项目类别：青年科学基金项目

批准号：41871080

批准年份：2018

资助金额：60.00

项目类别：面上项目

相似国自然基金

面向中文网络评论的产品特征挖掘方法研究

批准号：71001023

批准年份：2010

负责人：李实

学科分类：G0112

资助金额：16.10

项目类别：青年科学基金项目

结合领域知识的端到端论辩挖掘方法研究

批准号：61702106

批准年份：2017

负责人：魏忠钰

学科分类：F0211

资助金额：26.00

项目类别：青年科学基金项目

面向大型社会网络融合的关联用户挖掘模型与方法

批准号：71601013

批准年份：2016

负责人：周小平

学科分类：G0112

资助金额：17.00

项目类别：青年科学基金项目

用户评论上细粒度话题情感分析方法研究

批准号：61702391

批准年份：2017

负责人：徐悦甡

学科分类：F06

资助金额：24.00

项目类别：青年科学基金项目

面向用户评论的论辩挖掘方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

结直肠癌免疫治疗的多模态影像及分子影像评估

智能煤矿建设路线与工程实践

信息熵-保真度联合度量函数的单幅图像去雾方法

高扬的其他基金

Ia型超新星爆炸中燃烧学过程的理论研究

金属纳米天线阵列的光束调制和角度色散性质及其应用研究

紫色土丘陵区土壤有机碳、磷竞争吸附-解吸机制及其流失响应研究

融合语义相似性和关联性的深层主题模型研究

下丘脑外侧区神经免疫调节相关神经元功能下调模式研究

下丘脑外侧区神经免疫调节相关信号研究

应激损伤模型鼠海马脑区微环境中IL-6/IL-6R/sIL-6R/gp130信号的传递模式及其生物学意义

新常态下基于进化算法的金融产业结构多目标优化研究

钙离子对淡水水库浮游植物群落组成的影响及机制研究

LH和AA脑区参与神经免疫调节功能的信号与传导通路研究

未知环境中移动机器人探索式路径规划方法研究

亚热带流域13C、15N输出分异特征及其水文驱动机制

CD38信号通路在应激诱导的神经损伤与神经免疫调节功能间的作用研究

利用Halo轨道流形设计小推力深空飞行最优转移轨道

基于复合载药的可降解药物控释系统结构优化设计研究

伽利略木卫探测飞行轨道设计与优化

基于金属微纳枝晶表面双电层电容式压力响应原理的水凝胶基水下柔性电子皮肤构建及其流体水动力学检测性能研究

亚热带流域植硅体碳与硅循环耦合机制及其迁移转化过程

相似国自然基金