Many knowledge graphs (KGs), such as YAGO, DBpedia and Freebase, have been created for easy and rapid knowledge discovery for many applications. The enormous amount of linked knowledge enable researchers make better use of these data to develop data mining and information retrieval applications. Notably this linked data is usually extracted from human-edit knowledge systems. As a result, the consistency and the quality of the extracted data varies significantly and the completeness of the extracted graph is hardly guaranteed...To solve these problems, in this project, we will study the techniques for knowledge construction, inference and question-answering from multi-source heterogeneous data. In specific, in this project, the creation of a unified knowledge representation method (including the entity schema, the relation specification and the type hierarchical structure) and the fusion of multiple knowledge sources will be first studied. Then, to enhance the existing multi-relational knowledge base embedding approach, the side information will be taken into consideration to improve the entity and relation embedding. This helps us to develop better link prediction and instance reconstruction models for extending the created KG. Finally, knowledge inference and the question-answering models will be developed to demonstrate the applicability of KGs...The results of this project are of great significance to effectively promote the level of the understanding and the utilization of data and to improve the efficiency of traditional industries.
互联网数据的爆炸性增长,为人类从数据中发现事物的真相和内部规律提供了宝贵的机会,从海量数据中发现蕴含在其内部的知识变得日益重要,如何从中提取结构化知识、自动融合构建知识图谱、服务知识推理等问题具有重要的应用前景和实用价值。本项目将首先针对多源知识的异质性和多样性问题,研究多源异质数据中知识的提取方法,建立知识表达体系实现知识的统一表示,实现无序数据到知识图谱的转换;其次,针对知识描述的动态性和不完整性问题,研究知识图谱的自主扩充与关系重建机制,基于融合约束的多元关系知识表示学习方法,设计高效链接预测和可扩展的事实重建方法;最后,针对知识模式的关联性和扩展性问题,改进知识推理与问答方法,提升用户对于信息理解和利用的能力,探索事物间共同特征和因果关系,辅助用户更精准的获取所求信息。本项目的研究结果对于探索有效提高各行业理解和利用数据知识的水平、提高传统行业工作效率的方法具有重大意义。
互联网数据的爆炸性增长,为人类从数据中发现事物的真相和内部规律提供了宝贵的机会,从海量数据中发现蕴含在其内部的知识变得日益重要,如何从中提取结构化知识、自动融合构建知识图谱、服务知识推理等问题具有重要的应用前景和实用价值。本项目首先针对多源知识的异质性和多样性问题,研究了多源异质数据中知识的提取方法,建立了知识表达体系实现知识的统一表示,实现了无序数据到知识图谱的转换;其次,针对知识描述的动态性和不完整性问题,本项目研究了知识图谱的自主扩充与关系重建机制,提出了基于融合约束的多元关系知识表示学习方法,设计并实现了高效链接预测和可扩展的事实重建方法;最后,针对知识模式的关联性和扩展性问题,改进了现有知识推理与问答方法,提升了用户对于信息理解和利用的能力。本项目执行期间共发表高水平论文36篇,其中包括CCF A类论文20篇,申请专利5项,相关研究结果在航空工业中国航空技术研究所、国家互联网应急中心、中国科学技术协会、中国科学技术出版社、中国民航信息科技有限公司等单位落地应用,对于探索有效提高各行业理解和利用数据知识的水平、提高传统行业工作效率的方法具有重大意义。
{{i.achievement_title}}
数据更新时间:2023-05-31
城市生活垃圾热值的特征变量选择方法及预测建模
口腔扁平苔藓研究热点前沿的可视化分析
陆地棉无绒突变体miRNA的鉴定及其靶标基因分析
区块链技术:从数据智能到知识自动化
油源断裂输导和遮挡配置油气成藏有利部位预测方法及其应用
基于多源异构数据的知识图谱补全及验证关键技术研究
基于多源异构特征表达的跨媒体问答研究
众包大数据多源异构融合与知识学习
东盟多语种事件知识图谱构建与推理方法研究