With the rapid growth of online news services and social media, users can now actively respond to online news by making comments expressing subjective emotions such as sadness, surprise, and anger. Such emotions can help understand the preferences and perspectives of individual users, and therefore may facilitate online publishers to provide users with more relevant services. . The evidence for emotion often comes from heterogeneous information sources. As some sources tend to be more reliable and indicative than the others, different information sources need to receive different weights to reflect their degrees of importance, which may lead to unsatisfactory performance of emotion tagging. In addition, although building emotion classifiers is a practical task, it highly depends on sufficient training data that is not easy to be collected directly and the manually labeling work of comments can be quite labor intensive. Also, online news has different collections and different domains, which make the problem even harder as different collections require different training data and different word distributions of the domains require different classifiers with corresponding distinct training data. . This paper tackles the task of emotion tagging for comments of cross-collection and cross-domain online news. 1)This project proposes a series of discriminative probabilistic models which merge and weight heterogeneous information sources in the context of emotion tagging. In particular, we propose a meta classification model which can associate the combination weights with specific comments and users. 2)This project proposes a cross-training framework which can exploit knowledge about emotion tagging classifier in one collection to make better inferences about same assignments in another related collection with same domain. The knowledge can be transferred across different collections by sharing same parametric sets. 3)This project proposes a novel framework to transfer knowledge across different news domains. More specifically, different approaches have been proposed when the two domains share the same set of emotion categories or use different categories..
越来越多的民众通过在线新闻了解时事动态,以新闻评论的形式抒发情感。掌握用户情感,可帮助在线新闻服务商理解用户偏好,为用户提供更好的个性化服务;也有助于政府进行民意问询,有效实现舆情分析和监控。情绪分类方法性能很大程度依赖于足够的训练数据,不同异构数据集合和不同领域的在线新闻情绪分析需要不同的分类器和各自充分的训练数据,但人工标注工作耗时耗力且代价高昂。针对上述问题,本项目将围绕在线新闻评论的多类情绪预测问题,研究1)融合多种异构信息源的用户个性化和评论个性化情绪分析技术;2)利用含有已标注数据文档集的分类知识帮助没有标注数据文档集的情绪分析任务,实现跨异构数据集的在线新闻评论情绪预测;3)在源领域和目标领域情感类别集合相同和不同两种情境下,实现跨领域跨类别在线新闻评论情绪分析等,以期取得情绪预测性能的提升和情绪分析服务的个性化、领域广泛化,尽量减少耗时耗力的人工标注工作。
越来越多的民众通过在线新闻了解时事动态,以新闻评论的形式抒发情感。掌握用户情感,可帮助在线新闻服务商理解用户偏好,为用户提供更好的个性化服务;也有助于政府进行民意问询,有效实现舆情分析和监控。.情绪分类方法性能很大程度依赖于足够的训练数据,不同异构数据集合和不同领域的在线新闻情绪分析需要不同的分类器和各自充分的训练数据,但人工标注工作耗时耗力且代价高昂。针对上述问题,本项目将围绕在线新闻评论的多类情绪预测问题,研究1)融合多种异构信息源的用户个性化和评论个性化情绪分析技术;2)利用含有已标注数据文档集的分类知识帮助没有标注数据文档集的情绪分析任务,实现跨异构数据集的在线新闻评论情绪预测;3)在源领域和目标领域情感类别集合相同和不同两种情境下,实现跨领域跨类别在线新闻评论情绪分析。.课题组解决了融合多种信息源的情绪分析技术,异构数据之间共享特征的知识迁移的情绪分析技术,对领域分布差异和不同情绪类别集合关系建模的情绪分析技术等关键技术问题,主要取得了以下研究成果:.提出了融合多种信息源的个性化情绪分析方案,实现了基于单一信息源的情绪分析方法,设计了基于混合模型的个性化情绪分析框架,并基于深度神经网络模型实现了融合在线新闻文本、新闻评论、情感投票多信息源的在线新闻评论情绪预测方法,大大提高了情绪分析的效果。.提出了一种跨异构数据集的情绪分析技术,运用迁移学习的思想,利用相同领域相关在线新闻评论文档集的分类知识来帮助目标评论文文档集的情绪预测,通过分析新闻评论文档集间的相同属性和异构关系,模拟了不同文档集间的结构差异,结合相关文档集的共享特征,构建多文档集通用的情绪预测解决方案,设计并实现了设计兼顾情绪预测性能和时间复杂度的高效学习算法。.提出了跨领域的情绪分析方法,构建了基于实例迁移的跨领域情绪分析框架,并实现了跨领域、跨类别的情绪分析方法,极大地降低了人工标注的工作量。.本项目的研究取得情绪预测性能的提升和情绪分析服务的个性化、领域广泛化,大大减少耗时耗力的人工标注工作,具有巨大的应用价值。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于文献计量学和社会网络分析的国内高血压病中医学术团队研究
长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移
TRPV1/SIRT1介导吴茱萸次碱抗Ang Ⅱ诱导的血管平滑肌细胞衰老
现代优化理论与应用
心肌缺血再灌注损伤时长链非编码RNA(AK138945)-miRNA-内质网应激调控网络的机制研究
基于认知特征的新闻事件在线评论观点自动摘要方法与社会情绪测量模型
面向在线新闻的公众情感计算与舆情分析关键技术
读者视角的跨领域隐式情感分析理论及关键技术研究
面向多视角决策支持的基于在线评论的群体偏好分析方法研究