Knowledge graph stores entities and relations in the form of graph, which can provide semantic supports for the next generation search engines. An important way to construct knowledge graph is automatically extracting entities and relations from Internet. Due to the limitation of natural language processing and artificial intelligence, the confidences of some automatically extracted relations are not high, which will degrade the quality of query results on the knowledge graphs. As such, the usability of the knowledge graphs is also severely degraded. In this project, we aim to promote the quality of query results by exploiting human-powered solution, such as crowdsourcing, to clean the uncertain relations in the knowledge graph. We focus on a typical structural query on knowledge graph, i.e., reachability query. We aim at researching how to properly select relations and how to clean these relations to maximizing the quality improvement. In detail, we will study 1) single-query single-relation crowdsourcing cleaning, 2) single-query multi-relation crowdsourcing cleaning and 3) multi-query multi-relation crowdsourcing cleaning. The result of this project will help to promote the usability of the knowledge graphs and clear the way for the large-scale promotion of them.
知识图谱以图数据记录实体与实体间关系,为下一代搜索引擎提供语义级别支持。自动从互联网挖掘实体与关系是知识图谱构建的重要方式,然而由于自然语言处理和人工智能等技术的限制,自动挖掘出的关系可信度不高,从而导致在知识图谱之上的查询存在不确定性,质量不高,严重影响知识图谱的可用性。本项目拟采用众包等人工干预手段对知识图谱中不确定性关系进行清洗,以提高热门查询的结果质量。针对知识图谱中典型的结构查询:可达性查询,研究如何在不确定知识图谱中选取最合适的关系,以及如何对这些关系进行清洗,以达到结构查询结果质量提升的最大化。具体来说,我们研究:1)单查询单关系众包清洗;2)单查询多关系众包清洗;3)多查询多关系众包清洗。相信本项目的研究成果将很好地提升知识图谱的可用性,为其大规模推广扫清障碍。
知识图谱以图数据记录实体与实体间关系,为下一代搜索引擎提供语义级别支持。自动从互联网挖掘实体与关系是知识图谱构建的重要方式,然而由于自然语言处理和人工智能等技术的限制,自动挖掘出的关系准确度不高,从而导致在知识图谱之上的查询存在不确定性,质量不高,严重影响知识图谱的可用性。本项目拟采用众包等人工干预手段对知识图谱中不确定性关系进行清洗,以提高热门查询的结果质量。针对知识图谱最典型的结构查询——可达性查询、研究如何在不确定知识图谱中选取最合适的关系,以及如何对这些关系进行清洗,以达到结构查询结果质量提升的最大化。具体来说,我们提出了:1)单查询单关系众包清洗策略;2)单查询多关系众包清洗策略;3)多查询多关系众包清洗策略。实验证明,我们提出的清洗策略能够高效迅速地找到较大清洗收益的边,达到较高的清洗质量。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于被动变阻尼装置高层结构风振控制效果对比分析
基于改进LinkNet的寒旱区遥感图像河流识别方法
强震过程滑带超间隙水压力效应研究:大光包滑坡启动机制
血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展
基于SSR 的西南地区野生菰资源 遗传多样性及遗传结构分析
基于众包技术的知识图谱精化研究
基于众包的数据清洗关键技术研究
面向大规模知识图谱的查询处理关键技术研究
面向知识图谱自然语言问答的结构化查询生成关键技术研究