基于Valence-Arousal空间的维度型中文文本情感分析研究

基本信息
批准号:61702443
项目类别:青年科学基金项目
资助金额:29.00
负责人:王津
学科分类:
依托单位:云南大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:周小兵,刘曦,李杰,张昊伟,王楠,袁航
关键词:
情感计算维度型方法ValenceArousal空间中文文本情感分析语义嵌入
结项摘要

Compared with existing categorical approach, the dimensional approach can provide more fine-grained sentiment analysis. However, there are still several difficulties in current relevant research works for Chinese text, such as poor coverage of affective lexicons and corpora resource, and low performance and accuracy of existing analysis methods. Based on continuous valence-arousal (VA) space, this project proposes to research on dimensional sentiment analysis for Chinese text on word-, phrase-, sentence- and text-level. Main content include:. (1) By introducing affective information into the training procedure, a word vector refinement model will be proposed. This model is expected to tackle the problem of lacking affective information in current word vectors.. (2) On phrase-level, an automatic weight learning model will be proposed to predict sentiment intensity for modifier phrase. By combining the intensity of the content word and the shifting weight of the modifier within the phrase, the model can address the low accuracy problem in existing rule-based method.. (3) On text-level, a six-layer neural network model will be proposed to predict VA values for given texts. Based on stacked residual LSTM units, this model can solve the degradation and low performance problems in existing deep models for dimensional sentiment analysis.. Overall, this project seeks to provide a systematic framework of dimensional sentiment analysis, build a Chinese VA lexicon, and implement a prototype system of sentiment analysis for Chinese Text.

区别于现有类别型方法,维度型文本情感分析方法可以提供更为准确细致的情感信息。目前针对中文文本的维度型研究仍面临词典和语料资源覆盖性差,现有分析方法效率及准确度低等问题。项目基于Valence-Arousal(VA)空间,研究从词汇、短语、句子和文本等多个层次进行中文维度型文本情感分析,具体包括三个方面的内容:1) 通过将情感信息引入词嵌入的学习过程,形成基于情感信息的词向量修正模型,解决现有词向量无情感信息的问题;2) 在短语层次,实现基于自动权重学习的修饰词短语情感强度预测模型,整合实词的情感强度以及修饰词的修饰权重,解决现有基于规则方法中准确率低的问题;3) 在文本层次,利用基于残差堆叠的长短期记忆模型,构建一个六层神经网络实现文本层次的VA值预测,解决深层模型的退化问题。项目希望形成一套系统性的维度型中文文本情感分析方法,构建中文VA情感词典,实现中文文本情感分析的原型系统。

项目摘要

区别于现有类别型方法,维度型文本情感分析方法可以提供更为准确细致的情感信息。目前针对中文文本的维度型研究仍面临词典和语料资源覆盖性差,现有分析方法效率及准确度低等问题。项目基于Valence-Arousal(VA)空间,研究从词汇、短语、句子和文本等多个层次进行中文维度型文本情感分析,具体包括三个方面的内容:1) 通过将情感信息引入词嵌入的学习过程,形成基于情感信息的词向量修正模型,解决现有词向量无情感信息的问题;2) 在短语层次,实现基于自动权重学习的修饰词短语情感强度预测模型,整合实词的情感强度以及修饰词的修饰权重,解决现有基于规则方法中准确率低的问题;3) 在文本层次,利用基于残差堆叠的长短期记忆模型,构建一个六层神经网络实现文本层次的VA值预测,解决深层模型的退化问题。项目形成了一套系统性的维度型中文文本情感分析方法,构建中文VA情感词典,实现中文文本情感分析的原型系统。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

一种基于多层设计空间缩减策略的近似高维优化方法

一种基于多层设计空间缩减策略的近似高维优化方法

DOI:10.1051/jnwpu/20213920292
发表时间:2021
2

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
3

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

DOI:10.11842/wst.20190724002
发表时间:2020
4

基于主体视角的历史街区地方感差异研究———以北京南锣鼓巷为例

基于主体视角的历史街区地方感差异研究———以北京南锣鼓巷为例

DOI:
发表时间:2019
5

智能煤矿建设路线与工程实践

智能煤矿建设路线与工程实践

DOI:10.13199/j.cnki.cst.2020.07.010
发表时间:2020

王津的其他基金

批准号:51505027
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目
批准号:41773011
批准年份:2017
资助金额:69.00
项目类别:面上项目
批准号:41303007
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目

相似国自然基金

1

中文文本情感倾向挖掘技术研究

批准号:60673038
批准年份:2006
负责人:黄萱菁
学科分类:F0211
资助金额:26.00
项目类别:面上项目
2

社交媒体中文本情感语义计算理论和方法

批准号:61632011
批准年份:2016
负责人:秦兵
学科分类:F0211
资助金额:265.00
项目类别:重点项目
3

中文社交化短文本情感分析与话题挖掘研究

批准号:71501003
批准年份:2015
负责人:王德庆
学科分类:G0112
资助金额:17.40
项目类别:青年科学基金项目
4

情感驱动的人机交互中文本语音情感信息耦合关键技术研究

批准号:61203315
批准年份:2012
负责人:孙晓
学科分类:F0604
资助金额:24.00
项目类别:青年科学基金项目