随着Web 2.0的迅速发展,互联网逐渐成为人们表达观点、情感的重要渠道,互联网上的主观信息迅速增长。对这些观点和评论进行分析能够帮助企业改进产品与服务,及时修复可能潜在恶化的客户关系,提高企业在市场中的竞争力,因而具有非常重要的应用价值与实践意义。本体提供了共享特定领域信息内容的框架,作为智能知识处理的核心技术在计算机信息处理领域获得广泛的应用,并取得了较好的效果。本项目拟将本体技术与观点挖掘结合起来,研究如何对WEB2.0环境下的多种网络数据源(例如BBS 、Blog、RSS等)的主观评论信息进行收集,基于机器学习进行产品本体构建和情感词汇本体构建,并利用构建的本体对产品属性在词汇和句子两个层次进行自动化地极性分析,得到观点极性集合,从而将非结构化的网上主观评论以清晰的结构化方式显示,继而解决海量的评论信息与有限的人工阅读能力之间的矛盾。
本体提供了共享特定领域信息内容的框架,作为智能知识处理的核心技术在计算机信息处理领域获得广泛应用,并取得了较好的效果。本项目将本体学习技术与观点挖掘结合起来,对WEB2.0环境下的多种网络数据源(包括网络评论、维基百科、学术数据库等)的信息进行收集,基于机器学习对产品本体构建和情感词汇本体构建进行了理论探索与实证研究,并利用构建的本体对观点挖掘进行了探索。在产品属性识别方面,提出了一种将自然语言处理技术与支持向量机模型相结合,从客户评论中识别产品属性的方法。在产品名称识别方面,以餐饮评论中的产品名称识别为例,对利用条件随机场模型从产品评论中识别产品名称进行原理分析和实证研究,验证了条件随机场模型对于产品名称识别的效果。本研究还提出了潜在狄利克雷分布模型与自然语言处理技术相结合的一种挖掘用户评论热点的方法,利用Gibbs抽样计算模型参数, 获取了评论热点及相应的热点词语。实验获得的主题内容较好地反映了评论中的热点, 与现实生活中用户所关心的热点基本吻合, 表明该模型具有较好的热点识别效果。
{{i.achievement_title}}
数据更新时间:2023-05-31
Efficient photocatalytic degradation of organic dyes and reaction mechanism with Ag2CO3/Bi2O2CO3 photocatalyst under visible light irradiation
监管的非对称性、盈余管理模式选择与证监会执法效率?
黄河流域水资源利用时空演变特征及驱动要素
Empagliflozin, a sodium glucose cotransporter-2 inhibitor, ameliorates peritoneal fibrosis via suppressing TGF-β/Smad signaling
基于SSVEP 直接脑控机器人方向和速度研究
基于FrameNet的中文评价词汇本体构建与观点挖掘研究
认知观点下基于粒计算的概念学习
异构环境下基于社交数据的大规模本体学习模型研究
大数据环境下基于特征本体学习的无监督文本分类方法研究