Knowledge graph stores entities and relations in the form of graph, which can provide semantic supports for the next generation search engines. An important way to construct knowledge graph is automatically extracting entities and relations from Internet. Due to the limitation of natural language processing and artificial intelligence, the confidences of some automatically extracted relations are not high, which will degrade the quality of query results on the knowledge graphs. As such, the usability of the knowledge graphs is also severely degraded. In this project, we aim to promote the quality of query results by exploiting human-powered solution, such as crowdsourcing, to clean the uncertain relations in the knowledge graph. We focus on a typical structural query on knowledge graph, i.e., reachability query. We aim at researching how to properly select relations and how to clean these relations to maximizing the quality improvement. In detail, we will study 1) single-query single-relation crowdsourcing cleaning, 2) single-query multi-relation crowdsourcing cleaning and 3) multi-query multi-relation crowdsourcing cleaning. The result of this project will help to promote the usability of the knowledge graphs and clear the way for the large-scale promotion of them.
知识图谱以图数据记录实体与实体间关系,为下一代搜索引擎提供语义级别支持。自动从互联网挖掘实体与关系是知识图谱构建的重要方式,然而由于自然语言处理和人工智能等技术的限制,自动挖掘出的关系可信度不高,从而导致在知识图谱之上的查询存在不确定性,质量不高,严重影响知识图谱的可用性。本项目拟采用众包等人工干预手段对知识图谱中不确定性关系进行清洗,以提高热门查询的结果质量。针对知识图谱中典型的结构查询:可达性查询,研究如何在不确定知识图谱中选取最合适的关系,以及如何对这些关系进行清洗,以达到结构查询结果质量提升的最大化。具体来说,我们研究:1)单查询单关系众包清洗;2)单查询多关系众包清洗;3)多查询多关系众包清洗。相信本项目的研究成果将很好地提升知识图谱的可用性,为其大规模推广扫清障碍。
知识图谱以图数据记录实体与实体间关系,为下一代搜索引擎提供语义级别支持。自动从互联网挖掘实体与关系是知识图谱构建的重要方式,然而由于自然语言处理和人工智能等技术的限制,自动挖掘出的关系准确度不高,从而导致在知识图谱之上的查询存在不确定性,质量不高,严重影响知识图谱的可用性。本项目拟采用众包等人工干预手段对知识图谱中不确定性关系进行清洗,以提高热门查询的结果质量。针对知识图谱最典型的结构查询——可达性查询、研究如何在不确定知识图谱中选取最合适的关系,以及如何对这些关系进行清洗,以达到结构查询结果质量提升的最大化。具体来说,我们提出了:1)单查询单关系众包清洗策略;2)单查询多关系众包清洗策略;3)多查询多关系众包清洗策略。实验证明,我们提出的清洗策略能够高效迅速地找到较大清洗收益的边,达到较高的清洗质量。
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
基于FTA-BN模型的页岩气井口装置失效概率分析
肉苁蓉种子质量评价及药材初加工研究
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
服务经济时代新动能将由技术和服务共同驱动
基于众包技术的知识图谱精化研究
基于众包的数据清洗关键技术研究
面向大规模知识图谱的查询处理关键技术研究
面向知识图谱自然语言问答的结构化查询生成关键技术研究