Aspect-based sentiment classification is an importance topic in sentiment analysis, opinion mining and social media analysis. Recently, researchers focus on text features and text classification models. However, the confined semantic information from the text limits the performance of classifier. In practice, the interactive information between users in social media and the knowledge of aspect from knowledge base will provide more semantic information. In this project, we aim to use multi-source representation learning to improve aspect-based sentiment analysis in social media. Firstly, we will utilize syntactic structure and sentiment information by attention mechanism to map the text into low dimensional vector space in order to represent the text based on the context. Then, we will introduce user interactive information into representation learning by heterogeneous network embedding. In the knowledge representation, we plan to use multi-source restricted knowledge representation to learn the representation of aspect and introduce the aspect level knowledge representation into sentiment analysis by attention mechanism. Finally, we will design an End-to-End architecture to map the text, user and aspect knowledge into an unified representation for sentiment analysis in social media. The result of our work will improve the research of sentiment analysis in social media, and it will be also implemented in practical applications such as financial prediction by sentiment analysis.
属性情感分类是社交媒体文本情感分析与挖掘领域的重要研究问题。现有方法主要利用文本内部特征构建分类模型,由于文本包含的语义信息有限,导致分类性能受限。考虑到社交媒体中的用户交互信息以及开放知识库的属性知识可以提供更多语义知识来源,本项目拟开展基于多源语义表示学习的社交媒体文本属性情感分类研究。具体包括:利用文本结构与情感信息进行注意力机制下的表示学习,研究基于上下文语境的文本情感语义表示方法;通过异质网络节点嵌入模拟面向用户、内容和属性,研究融合用户交互信息的文本情感语义表示方法;通过多源约束下的知识表示对属性进行情感推理与消歧,研究融合开放知识库的文本情感语义表示方法;应用端到端的学习机制,实现文本、用户与属性知识的统一语义表示,研究基于多源语义表示的属性情感分类方法。在此基础上,构建面向证券领域的情感分类示范应用。本研究将推动社交媒体文本情感分析的基础研究,也为社交媒体相关应用提供借鉴。
本项目从“文本-用户-属性知识”三个层面出发,建立融合“文本-用户-属性知识”的统一语义表示学习框架,开展基于多源语义表示学习的社交媒体文本属性情感分类研究,主要包括:首先,在文档表示方面,充分考虑视角与上下文之间的关系、上下文中不同词语之间的语义联系、词序信息等,开展了基于上下文语境的文本情感语义表示方法和基于深度学习的视角级文本情感分类两方面研究。其次,在知识表示方面,根据上下文将词汇进行知识、概念层面的抽象,并在语义层面考虑词汇之间的语义联系,设计了融合文本概念化与网络表示的“文本-知识”语义表示。然后,在多源语义融合方面,利用节点在网络中的高阶相似性、节点结构相似性和属性信息,设计融合“文本-节点关系-属性信息”的统一语义表示,并应用于情感属性多标签分类。接着,研究结合表示学习和迁移学习的跨领域情感分类方法,有效缓解了若干领域缺乏情感标注样本的问题。最后,集成上述研究成果设计构建面向证券领域的情感分类原型系统,并应用于产学研项目“大数据驱动的金融智能服务平台”,取得了较好的示范应用效果。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析
铁路大跨度简支钢桁梁桥车-桥耦合振动研究
基于暂态波形相关性的配电网故障定位方法
基于深度表示和迁移学习的社交媒体多模态情感分析
社交媒体中文本情感语义计算理论和方法
面向社交媒体的多语种文本情感分析方法研究
基于深度迁移学习的跨领域文本情感分类方法研究