There are broad prospects in sentiment classification which can bring huge economic and social effects. However, the methods of sentiment classification rely on high-quality labeled resources, and the distribution of labeled resources in different languages is seriously unbalanced. Cross-lingual sentiment classification technology is committed to solve this problem. Most of the existing methods rely on Machine Translation or aligned parallel corpus. However, Machine Translation often result in poor quality. Meanwhile, cross-lingual parallel alignment of corpora is also lacking. The difficulty of cross-lingual sentiment classification is how to realize the transformation of two different spaces or knowledge. To solve the above problems, this project research on bi-lingual document representation and deep transfer learning, and aims to propose common document embedding model and cross-lingual sentiment classification methods based on deep transfer learning which don’t rely on machine translation and parallel corpus to improve the performance.
情感分类具有广阔的应用前景,可以带来巨大的经济和社会效益。然而情感分类方法依赖于高质量的情感资源,不同语言的情感资源分布严重不均衡,跨语言情感分类技术致力于解决这个问题。跨语言文本情感分类研究的难点在于如何实现两种不同空间的转换或知识迁移。目前已有的跨语言情感分类方法大都依赖机器翻译或者大规模高质量的并行对齐语料。然而,机器翻译过程中会带来错误导致翻译语料质量不高,同时跨语言并行对齐语料在实际应用中也是很缺乏的。针对以上问题,本项目以产品评论数据为研究对象,围绕着跨语言文本的表示学习和深度迁移学习等科学问题,研究基于共享空间的文档表示模型、基于词向量的歧义消解技术、基于深度学习的跨语言分类等关键技术,旨在有效提升跨语言情感分类效果。
跨语言文本情感分类研究的难点在于如何实现两种不同空间的转换或知识迁移。目前已有的跨语言情感分类方法大都依赖机器翻译或者大规模高质量的并行对齐语料。然而,机器翻译过程中会带来错误导致翻译语料质量不高,同时跨语言并行对齐语料在实际应用中也是很缺乏的。针对以上问题,本项目围绕着跨语言文本的表示学习和深度迁移学习等科学问题,研究基于共享空间的文档表示模型、基于词向量的歧义消解技术、基于深度学习的跨语言分类等关键技术,旨在有效提升跨语言情感分类效果。. 项目研究了双语词向量表示方法,分析了目前解决跨语言情感分类算法中的主流方法—基于映射的方法中存在的主要问题,提出了基于非线性映射的双语词向量表示方法;项目研究了更有效的文档表示方法,并在此基础上进一步研究了共享空间下的双语文档向量表示,提出了融合多特征的文本对齐跨语言情感分类方法,使得同一语言里的相似文档有近似的表示,并且不同语言间的相似文档也有近似的表示,通过实验发现有效提升了跨语言情感分类的准确率;项目研究了基于深度迁移学习的跨语言情感分类方法,提出了基于生成对抗和双向GRU网络的模型,并进一步研究了如何不需要双语对齐语料,只利用少量的词语对建立原始数据之间相互映射表达的学习机制。此外,项目还提出了高效的图神经网络表示算法,在基于图神经网络的情感分类方向上开展了有益的尝试。. 项目完成论文8篇,其中SCI三区以上期刊论文3篇,完成软件著作权1项。总数量达到申请书中的目标。提出的共享空间词向量和文本向量学习算法也受到了同行的认可。基于现有成果所开发的情感分类系统有很好的应用前景,可以帮助情感资源缺乏的语种实现较为准确的情感分类,帮助其构建本国语种的情感分类系统,继而可应用于舆情分析、金融预测等领域。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
基于深度迁移学习的跨领域文本情感分类方法研究
基于深度学习和迁移学习的东盟跨语言查询扩展研究
基于子空间迁移学习的跨语种语音情感识别研究
面向小数据语音建模的跨语言迁移学习研究