Under the same subject, we cannot use the traditional subject based text classification methods to automatically identify the semantic orientation of an article, which are described in positive mood, negative mood or neutral mood. The research objective of this project is the most hot public opinion articles of Internet, whose subject is certain particular to common articles. The subject of Internet public opinion article are majored in social issues, policy-oriented approach, ideology, harmful information..After analyzing the features of Internet public opinion articles, our research will focus on some key problems:.①The concept of text texture is proposed Creatively, and a new feature selection and expression methods is proposed based on this concept..②Based on text texture features, the satirical writing style is predicated automatically. .③Study on emotional Word, adjective and adverb electronic resource construction and the annotation of emotional ambiguity..④Based on machine learning methods, the emotional sentences and textual emotion are recognized automatically..The research results by this project should be used not only in the areas of Internet public opinions, but also other areas, such as the semantic orientation recognition of commodity evaluation, the semantic orientation recognition of literary, the semantic orientation recognition of movie review .etc.
在相同主题下,如何自动识别文章的情感倾向性,即正面描述、反面描述或者客观中立描述,不能照搬传统的面向主题内容的文本自动分类方法。本课题的研究对象是当前国内最热点的网络舆论文章,而网络舆论文章的主题具有一定的特殊性:主要面向社会问题、政策方针、意识形态、不良信息等。在分析了网络舆论文章特点的基础上,课题拟研究如下内容:创造性地提出了篇章纹理的概念,并基于这个概念,提出了篇章纹理特征选择和表达方法;基于篇章纹理特征,进行讽刺性文章写作风格自动识别;研究情感词、形容词和副词电子资源库的建设,以及情感歧义的标注;基于机器学习的方法,研究情感句子的自动识别和篇章情感的自动识别等。本课题的研究成果除了应用于网络舆论领域外,经过调整也可以应用到下列领域:商品评价的情感性识别、文学作品的情感识别、电影评论的情感性识别等。
在相同主题下,如何自动识别文章的情感倾向性,即正面描述、反面描述或者客观中立描述,不能照搬传统的面向主题内容的文本自动分类方法。本项目在研究分析当前国内最热点的网络舆论文章、微博帖子、电子商务网站评论信息的基础上,研究了适合情感分类问题的特征词识别、特征处理、特殊句型处理及在线预测方法。.本项目的主要成绩如下:.(1). 本项目创造性地提出了篇章纹理的概念,并基于这个概念,提出了篇章纹理特征选择和表达方法。实验中使用的文本纹理主要包括:排比的修辞手法、否定修饰、程度副词修饰、转折句型等。.(2).重点实现了文本的主客观分类和情感分类系统,并且创新性地将文本纹理特征引入主客观和情感分类中,并给出分类流程的系统框图,系统框图中包括分词、Stanford Parser词语间关系解析、特征抽取、特征构造、分类器、分类结果评估部分,其后本文介绍了其中每个部分的实现方法,最后给出了与现存分类方法的对比实验步骤、数据及分析评估。.(3).对某些特殊结构的文本,本项目对传统的算法精心了改进,从语法意义以及结构意义上对短文本,否定结构文本进行了分析,提出各自的改进的方法,并且参加了相关会议的测评,根据发布的测评数据进行测试,从发布的结果看,都有不错的表现。.本项目的研究成果可以应用于网络舆论领域、商品评价的情感性识别、文学作品的情感识别、电影评论的情感性识别等等。
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
跨社交网络用户对齐技术综述
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
网络舆论发展趋势分析核心技术研究
面向网络舆论的动态本体学习模型研究
面向Web情感资源的倾向性分析技术研究
基于用户交互特性的社会网络情感分析技术研究