Topic mining plays a significant role in knowledge cognition from massive data. Current topic mining algorithms fail to explore the semantic understanding of natural language. The fuzzy semantics exists as a general problem which leads to poor usability. This proposal mainly focuses on the study of interactive visualized topic mining through combing human abstractive cognitive ability with efficient computing capabilities. We aim to obtain an incremental theme knowledge map for a specified research field to improve the semantic meaning of topic, by providing a helical of continuous human-machine fusion iterative process. First, we propose a multiple indicators system from both internal and external perspective of models. We intend to expand cognitive horizons by presenting the multiple-dimensional metrics which combine keywords and topic measurement in a visually interactive way; Secondly, we propose to investigate the methods to build a topic knowledge map, and regarding topic knowledge map as a medium of human-machine. Lastly, we propose to build a topic mining algorithm platform to validate algorithm performance. Once completed, we firmly believe our proposal will contribute to the semantic data analysis and broad application of interactive and visual data mining.
主题挖掘对于从宏观上认知海量数据所蕴含的知识具有重要的意义。目前,主题挖掘算法仍难以跨越自然语言语义理解的鸿沟,普遍存在分析结果语义明晰性差,可用性不高的问题。本项目旨在研究融合人类抽象认知能力和计算机高效计算能力的可视化互动式协同主题挖掘方法,通过构建螺旋式持续改进的人机融合迭代过程,形成面向指定领域的增量式主题知识图谱,并基于主题知识图谱解决现有主题挖掘方法缺乏自然语义性的问题。首先,研究模型内和模型外视角下的多元指标体系,以可视化互动方式组合展现主题词和主题的多维度计量指标,拓展使用者的数据认知视野;其次,研究主题知识图谱构建方法,并以主题知识图谱为媒介研究的人机能力融合方法;最后,构建主题挖掘算法平台验证算法性能。本项目的研究成果对于面向语义的数据分析以及基于可视化的交互式数据挖掘相关研究与应用具有积极的推动作用。
文本数据是重要的知识承载形式,主题挖掘是从文本数据中提取有组织的知识形式的重要方法。目前,主题挖掘算法在实际的复杂环境中普遍存在结果语义性差,可解释性不强等问题。本项目研究融合多元指标的交互式可视化主题模型,通过对非结构化文本的抽象形成可理解的知识形式,并基于知识之间的交互融合设计高语义性的主题模型,以可视化互动方式组合展现主题词和主题的多维度计量指标,突破了传统主题模型对知识实体独立同分布的假设,实现了在复杂环境下的文本知识抽取与组织。.本项目的研究成果实现了对文本数据的深层语义分析,有利于文本数据可视化技术的发展,推动了交互式数据挖掘的研究。本项目执行顺利,取得了预期的研究成果,发表了多篇高水平论文,培养了多名博士硕士研究生。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
多源数据驱动CNN-GRU模型的公交客流量分类预测
混采地震数据高效高精度分离处理方法研究进展
基于流面的交互式流场可视化方法
面向功能挖掘的代码主题建模技术研究
道路三维数据场网络交互式可视化理论与方法研究
流场显示及交互式可视化环境