With the increase of the requirement for semantic understanding, we have witnessed the emergence of many big knowledge graphs, which contain entities or concepts as the vertices and the semantic relationships as the edges. Meanwhile, many applications based on semantics understanding are demanding high quality query answering on knowledge graphs. However, there still exist many great challenges. In general, a typical knowledge graph is big, and it usually contains heterogeneous information, can be modeled by different models, and has a complex structure. To overcome these challenges, we propose this project to study the core query answering techniques on knowledge graphs, by employing the structural information of knowledge graph and summarizing the query model from real semantic based applications. We will investigate three key problems: the model of knowledge graphs, query answering algorithms and data organization techniques. We aim to proposing a collection of fundamental theories and efficient methods for query answering on knowledge graphs and overcome the challenge posed by the distributed big graph processing. The results of this project are good complements to the existing graph data processing techniques. The results are also helpful for the understanding the psychology mechanism of semantics on knowledge graphs. The proposed method can also find may valuable real applications.
近年来,随着语义理解需求的日益增长,知识图谱日益成为一种重要的表达各类实体、概念及其之间语义关系的新型知识表示形态。同时,各类基于语义理解的实际应用对面向知识图谱的查询处理提出了需求。然而知识图谱的海量规模、异构信息、多模形态和复杂结构对当前的图查询处理技术提出了全新的挑战。针对这些挑战,本项目拟围绕基于知识图谱的语义应用,建立知识图谱的表示模型,揭示知识图谱的结构特征,研究大规模知识图谱的查询处理关键技术,突破大图分布式数据组织和复杂知识图谱语义查询处理关键技术,实现高效的大规模知识图谱查询处理和数据组织方法。本项目对于进一步提升图数据管理的研究水平、阐释基于知识图谱的语义理解机制具有重要的学术意义;对于支撑现实应用中的语义查询具有较高的实际应用价值。
知识图谱作为一种大规模语义网络,为各类智能应用提供了丰富的背景知识,是各行业智能化升级与转型的关键。面向大规模知识图谱的查询处理等关键技术是进一步释放知识图谱价值的关键核心技术之一。本项目围绕大规模知识图谱构建、大规模知识图谱查询处理、知识图谱应用技术等展开研究,取得了丰硕研究与应用成果,开展了富有成效的国际交流,培养了一支知识图谱前沿技术研发团队,顺利完成了项目预期目标。通过本课题的开展,初步掌握了大规模知识图谱构建与应用关键技术,提出了一系列有效的数据驱动的知识图谱构建方法,显著提升了知识库质量,大大降低了知识库构建的人力成本,开辟了数据驱动的知识库构建新思路;提出了一系列基于知识图谱的机器语言认知模型,在国际上较早提出了利用大量存在的知识库提升自然语言理解、搜索与推荐等一系列实际应用的新思路。项目累计发表论文27篇,其中包括CCF A类会议与期刊11篇,包括TKDE、VLDB、IJCAI、AAAI等,以及CCF B类会议与期刊12篇,包括CIKM、ICDM、EMNLP等。申请专利两项。培养博士两名,硕士5名。出版专著1本。获得包括教育部自然科学二等奖(排名第二)、阿里巴巴Research Fellowship Award的奖项4项。构建了知识工场平台(kw.fudan.edu.cn),发布了一系列知识图谱以及相应的API服务,为数百家应用单位提供API服务近10亿次。相关技术受到包括华为、阿里巴巴等企业的持续资助,并在相应的实际应用场景取得了良好的应用效果。课题组基本按照原定计划执行,执行情况良好。本课题取得的成果应用前景广泛,在华为等企业的落地应用具有示范意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
论大数据环境对情报学发展的影响
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
服务经济时代新动能将由技术和服务共同驱动
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
资源型地区产业结构调整对水资源利用效率影响的实证分析—来自中国10个资源型省份的经验证据
大规模知识图谱上相似节点查询技术研究
面向知识图谱自然语言问答的结构化查询生成关键技术研究
基于外存的海量知识图谱数据的查询处理
基于大规模XML数据的关键字查询处理关键技术研究