意见挖掘的目标是从自然语言评价文本中抽取意见主题属性并分析和意见的情感极性(褒、贬或中性)。意见挖掘研究难点有二:一是未知主题词识别及其同主题概念的自动关联,二是情感词歧义消解以及未知情感词的情感极性分析。本项目提出意见单元和合一搭配表示方法,以主题属性词和情感词的合一搭配结构为主干,涵盖意见内和意见间上下文中出现的情感修饰词、否定词和连词。基于意见单元,我们提出搭配驱动意见挖掘方法,不仅考虑意见的主题属性词和情感词,还能从意见单元的合一搭配关系和情感上下文获取用于意见分类和聚类的重要特征,从而提高未知主题词识别的召回率和情感词识别与极性分析的准确率。该方法可在现有小规模标注评价语料库的基础上通过自举学习,从新的原始评价文本中自动获取未知主题词和未知情感词,实现主题词集和情感词集的自动扩充,从而提高该方法对新领域适应性。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析
铁路大跨度简支钢桁梁桥车-桥耦合振动研究
基于暂态波形相关性的配电网故障定位方法
网络意见挖掘若干前沿问题研究
基于情感分析的产品评论意见挖掘研究
面向Web主观性文本意见挖掘研究
Web文本意见挖掘关键技术研究