基于迁移学习的跨语言情感分类研究

基本信息
批准号:61806072
项目类别:青年科学基金项目
资助金额:24.00
负责人:李娜娜
学科分类:
依托单位:河北工业大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:董瑶,刘伯颖,董永峰,彭伟桃,付玉,张萌萌
关键词:
深度学习迁移学习情感分类跨语言
结项摘要

There are broad prospects in sentiment classification which can bring huge economic and social effects. However, the methods of sentiment classification rely on high-quality labeled resources, and the distribution of labeled resources in different languages is seriously unbalanced. Cross-lingual sentiment classification technology is committed to solve this problem. Most of the existing methods rely on Machine Translation or aligned parallel corpus. However, Machine Translation often result in poor quality. Meanwhile, cross-lingual parallel alignment of corpora is also lacking. The difficulty of cross-lingual sentiment classification is how to realize the transformation of two different spaces or knowledge. To solve the above problems, this project research on bi-lingual document representation and deep transfer learning, and aims to propose common document embedding model and cross-lingual sentiment classification methods based on deep transfer learning which don’t rely on machine translation and parallel corpus to improve the performance.

情感分类具有广阔的应用前景,可以带来巨大的经济和社会效益。然而情感分类方法依赖于高质量的情感资源,不同语言的情感资源分布严重不均衡,跨语言情感分类技术致力于解决这个问题。跨语言文本情感分类研究的难点在于如何实现两种不同空间的转换或知识迁移。目前已有的跨语言情感分类方法大都依赖机器翻译或者大规模高质量的并行对齐语料。然而,机器翻译过程中会带来错误导致翻译语料质量不高,同时跨语言并行对齐语料在实际应用中也是很缺乏的。针对以上问题,本项目以产品评论数据为研究对象,围绕着跨语言文本的表示学习和深度迁移学习等科学问题,研究基于共享空间的文档表示模型、基于词向量的歧义消解技术、基于深度学习的跨语言分类等关键技术,旨在有效提升跨语言情感分类效果。

项目摘要

跨语言文本情感分类研究的难点在于如何实现两种不同空间的转换或知识迁移。目前已有的跨语言情感分类方法大都依赖机器翻译或者大规模高质量的并行对齐语料。然而,机器翻译过程中会带来错误导致翻译语料质量不高,同时跨语言并行对齐语料在实际应用中也是很缺乏的。针对以上问题,本项目围绕着跨语言文本的表示学习和深度迁移学习等科学问题,研究基于共享空间的文档表示模型、基于词向量的歧义消解技术、基于深度学习的跨语言分类等关键技术,旨在有效提升跨语言情感分类效果。. 项目研究了双语词向量表示方法,分析了目前解决跨语言情感分类算法中的主流方法—基于映射的方法中存在的主要问题,提出了基于非线性映射的双语词向量表示方法;项目研究了更有效的文档表示方法,并在此基础上进一步研究了共享空间下的双语文档向量表示,提出了融合多特征的文本对齐跨语言情感分类方法,使得同一语言里的相似文档有近似的表示,并且不同语言间的相似文档也有近似的表示,通过实验发现有效提升了跨语言情感分类的准确率;项目研究了基于深度迁移学习的跨语言情感分类方法,提出了基于生成对抗和双向GRU网络的模型,并进一步研究了如何不需要双语对齐语料,只利用少量的词语对建立原始数据之间相互映射表达的学习机制。此外,项目还提出了高效的图神经网络表示算法,在基于图神经网络的情感分类方向上开展了有益的尝试。. 项目完成论文8篇,其中SCI三区以上期刊论文3篇,完成软件著作权1项。总数量达到申请书中的目标。提出的共享空间词向量和文本向量学习算法也受到了同行的认可。基于现有成果所开发的情感分类系统有很好的应用前景,可以帮助情感资源缺乏的语种实现较为准确的情感分类,帮助其构建本国语种的情感分类系统,继而可应用于舆情分析、金融预测等领域。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019

李娜娜的其他基金

批准号:81801061
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:31700615
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:51503144
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目
批准号:81602865
批准年份:2016
资助金额:18.00
项目类别:青年科学基金项目
批准号:41601358
批准年份:2016
资助金额:7.00
项目类别:青年科学基金项目
批准号:51905243
批准年份:2019
资助金额:24.00
项目类别:青年科学基金项目

相似国自然基金

1

基于深度迁移学习的跨领域文本情感分类方法研究

批准号:61906110
批准年份:2019
负责人:赵传君
学科分类:F0606
资助金额:24.00
项目类别:青年科学基金项目
2

基于深度学习和迁移学习的东盟跨语言查询扩展研究

批准号:61762006
批准年份:2017
负责人:黄名选
学科分类:F0211
资助金额:41.00
项目类别:地区科学基金项目
3

基于子空间迁移学习的跨语种语音情感识别研究

批准号:61572009
批准年份:2015
负责人:郑文明
学科分类:F0605
资助金额:56.00
项目类别:面上项目
4

面向小数据语音建模的跨语言迁移学习研究

批准号:61901473
批准年份:2019
负责人:易江燕
学科分类:F01
资助金额:26.00
项目类别:青年科学基金项目