With the rapid development of the Internet and Semantic Web technologies, traditional search engines have failed to meet the demand for massive web page text information and knowledge harvest. In this context, Knowledge Graph (KG) emerged, which greatly improved the accuracy of knowledge query, enhanced the timeliness of intelligence acquisition, and extended the boundaries and scope of knowledge acquisition. These advantages directly lead to the continuing development of KG. However, it is noted that the ability of KG for providing knowledge-related services at this stage is far lower than people's demand. It is also obvious that the insufficient depth of domain KGs is unable to support specific real-life scenarios. Therefore, how to construct fine-grained and accurate domain KGs is an urgent problem. .On the other hand, reinforcement learning has achieved good results in many fields because of its robustness and adaptability. Some have tried to apply it to the field of KG construction, whereas it is still a new topic and currently there is no KG construction system with the framework of reinforcement learning. .Therefore, this project focuses on devising relevant methods and techniques for the construction of domain KGs under the framework of reinforcement learning, and particularly on the extraction and fusion of domain-specific knowledge with sparse samples. It further validates the effectiveness of the proposal and forms a domain KG prototype system through extensive experiments.
随着互联网和语义Web技术的高速发展,传统的搜索引擎已经无法满足人们对海量的网页文本信息以及对知识捕获理解的需求。在此背景之下,知识图谱应运而生,其极大的提高了知识查询精度,提升了情报获取时效性,延伸知识获取的边界和范围。这些优势直接导致了当前知识图谱的构建工作呈现如火如荼的局面。然而,注意到现阶段知识图谱提供知识服务的能力远远低于人们对知识的需求,领域图谱中知识深度不足无法支撑具体业务场景的问题也较为明显;因此如何构建精细精准的领域知识图谱是当前亟待解决的问题。另一方面,强化学习就其突出鲁棒性和适应能力在多个领域取得了较好的效果,部分学者尝试将其用于知识图谱构建领域,但在强化学习框架下尚未形成较为完善的知识图谱构建体系。因此,本项目重点考虑强化学习框架下领域知识图谱构建的相关方法与技术,并将研究关注点落在样本稀疏的特定领域知识抽取与融合上,通过实验来验证效能并形成领域图谱构建原型系统。
随着互联网和语义Web技术的高速发展,传统的搜索引擎已经无法满足人们对海量的网页文本信息以及对知识捕获理解的需求。在此背景之下,知识图谱应运而生,其极大的提高了知识查询精度,提升了情报获取时效性,延伸知识获取的边界和范围。这些优势直接导致了当前知识图谱的构建工作呈现如火如荼的局面。然而,注意到现阶段知识图谱提供知识服务的能力远远低于人们对知识的需求,领域图谱中知识深度不足无法支撑具体业务场景的问题也较为明显;因此如何构建精细精准的领域知识图谱是当前亟待解决的问题。另一方面,强化学习就其突出鲁棒性和适应能力在多个领域取得了较好的效果,部分学者尝试将其用于知识图谱构建领域,但在强化学习框架下尚未形成较为完善的知识图谱构建体系。因此,本项目重点研究了三方面的内容:.(1)研究如何在强化学习框架下对远程监督生成的数据集进行提纯和过滤,生成高质量的标注数据集。.(2)研究基于强化学习框架的联合抽取模型来多三元组带来的关系重叠问题,提高了模型的鲁棒性和抽取性能。.(3)研究结合强化学习和深度学习实体链接模型,充分考虑实体和指称项的相关性和全局特征,提高实体链接的精度和准确率。.基于上述研究:.共发表论文15篇,出版专著1部,申请专利8相,并获得湖南省科技进步三等奖一项(排名第一)。.多次参加包括AAAI、CIKM、SIGIR在内的多个国际顶级会议,培养青年骨干教师 1 名,博士后 1 名,联合培养硕士生4名,博士生10名,达到了申请的相关指标要求。.依托项目研究成果,已成功联合中央军委装备发展部武器装备预研项目2项,173领域基金一项,173基础加强一项。具体在应用前景上:本项目所提技术可直接应用在海量知识图谱构建于关联中:首先,使用自然语言处理技术等预处理,抽取不同场景下的知识图谱实体和的关联关系,从而构建军事领域知识图谱。在此基础之上通过知识对齐和关联技术对不同的知识图谱融合实现大规模知识图谱构建,最后通过智能问答等技术实现基于情报的多模态智能问答实现军事场景的典型应用。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
跨社交网络用户对齐技术综述
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究
基于迁移学习的地理领域知识图谱构建技术
异质网络环境下动态知识图谱构建技术研究
构建传统蒙古文知识图谱关键技术研究
面向开放域数据的情报知识图谱构建技术研究