不确定知识图谱中面向结构查询的众包清洗研究

基本信息
批准号:61572193
项目类别:面上项目
资助金额:16.00
负责人:林欣
学科分类:
依托单位:华东师范大学
批准年份:2015
结题年份:2016
起止时间:2016-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:徐建良,宋树彬,钟哲凡,王智谨,陈晨,邱鑫,周慧君
关键词:
查询结果质量结构查询不确定知识图谱概率清洗众包清洗
结项摘要

Knowledge graph stores entities and relations in the form of graph, which can provide semantic supports for the next generation search engines. An important way to construct knowledge graph is automatically extracting entities and relations from Internet. Due to the limitation of natural language processing and artificial intelligence, the confidences of some automatically extracted relations are not high, which will degrade the quality of query results on the knowledge graphs. As such, the usability of the knowledge graphs is also severely degraded. In this project, we aim to promote the quality of query results by exploiting human-powered solution, such as crowdsourcing, to clean the uncertain relations in the knowledge graph. We focus on a typical structural query on knowledge graph, i.e., reachability query. We aim at researching how to properly select relations and how to clean these relations to maximizing the quality improvement. In detail, we will study 1) single-query single-relation crowdsourcing cleaning, 2) single-query multi-relation crowdsourcing cleaning and 3) multi-query multi-relation crowdsourcing cleaning. The result of this project will help to promote the usability of the knowledge graphs and clear the way for the large-scale promotion of them.

知识图谱以图数据记录实体与实体间关系,为下一代搜索引擎提供语义级别支持。自动从互联网挖掘实体与关系是知识图谱构建的重要方式,然而由于自然语言处理和人工智能等技术的限制,自动挖掘出的关系可信度不高,从而导致在知识图谱之上的查询存在不确定性,质量不高,严重影响知识图谱的可用性。本项目拟采用众包等人工干预手段对知识图谱中不确定性关系进行清洗,以提高热门查询的结果质量。针对知识图谱中典型的结构查询:可达性查询,研究如何在不确定知识图谱中选取最合适的关系,以及如何对这些关系进行清洗,以达到结构查询结果质量提升的最大化。具体来说,我们研究:1)单查询单关系众包清洗;2)单查询多关系众包清洗;3)多查询多关系众包清洗。相信本项目的研究成果将很好地提升知识图谱的可用性,为其大规模推广扫清障碍。

项目摘要

知识图谱以图数据记录实体与实体间关系,为下一代搜索引擎提供语义级别支持。自动从互联网挖掘实体与关系是知识图谱构建的重要方式,然而由于自然语言处理和人工智能等技术的限制,自动挖掘出的关系准确度不高,从而导致在知识图谱之上的查询存在不确定性,质量不高,严重影响知识图谱的可用性。本项目拟采用众包等人工干预手段对知识图谱中不确定性关系进行清洗,以提高热门查询的结果质量。针对知识图谱最典型的结构查询——可达性查询、研究如何在不确定知识图谱中选取最合适的关系,以及如何对这些关系进行清洗,以达到结构查询结果质量提升的最大化。具体来说,我们提出了:1)单查询单关系众包清洗策略;2)单查询多关系众包清洗策略;3)多查询多关系众包清洗策略。实验证明,我们提出的清洗策略能够高效迅速地找到较大清洗收益的边,达到较高的清洗质量。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

基于FTA-BN模型的页岩气井口装置失效概率分析

基于FTA-BN模型的页岩气井口装置失效概率分析

DOI:10.16265/j.cnki.issn1003-3033.2019.04.015
发表时间:2019
3

肉苁蓉种子质量评价及药材初加工研究

肉苁蓉种子质量评价及药材初加工研究

DOI:10.11842/wst.2017.02.019
发表时间:2017
4

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
5

服务经济时代新动能将由技术和服务共同驱动

服务经济时代新动能将由技术和服务共同驱动

DOI:10.19474/j.cnki.10-1156/f.001172
发表时间:2017

林欣的其他基金

批准号:61773167
批准年份:2017
资助金额:64.00
项目类别:面上项目
批准号:81570211
批准年份:2015
资助金额:67.00
项目类别:面上项目
批准号:91942303
批准年份:2019
资助金额:250.00
项目类别:重大研究计划
批准号:60903169
批准年份:2009
资助金额:17.00
项目类别:青年科学基金项目
批准号:91542107
批准年份:2015
资助金额:70.00
项目类别:重大研究计划
批准号:30872599
批准年份:2008
资助金额:28.00
项目类别:面上项目
批准号:81630058
批准年份:2016
资助金额:275.00
项目类别:重点项目

相似国自然基金

1

基于众包技术的知识图谱精化研究

批准号:61773167
批准年份:2017
负责人:林欣
学科分类:F0305
资助金额:64.00
项目类别:面上项目
2

基于众包的数据清洗关键技术研究

批准号:61472198
批准年份:2014
负责人:冯建华
学科分类:F0202
资助金额:86.00
项目类别:面上项目
3

面向大规模知识图谱的查询处理关键技术研究

批准号:61472085
批准年份:2014
负责人:肖仰华
学科分类:F0202
资助金额:83.00
项目类别:面上项目
4

面向知识图谱自然语言问答的结构化查询生成关键技术研究

批准号:61902074
批准年份:2019
负责人:郑卫国
学科分类:F0202
资助金额:27.00
项目类别:青年科学基金项目