基于迁移学习的地理领域知识图谱构建技术

基本信息

批准号：61702386

项目类别：青年科学基金项目

资助金额：24.00

负责人：段鹏飞

学科分类：

依托单位：武汉理工大学

批准年份：2017

结题年份：2020

起止时间：2018-01-01 - 2020-12-31

项目状态：已结题

项目参与者：熊盛武,解庆,DAHOU ABDELGHANI,张小红,毛晶晶,陈振东

关键词：

迁移学习实体关系抽取表示学习

结项摘要

The technology of knowledge graph construction is an important foundation for humanoid intelligence development. This project focuses on the work of knowledge graph construction in specific fields represented by geography, carries out research work on natural language processing with scientific issues such as adaptability of transfer learning and distributed representation of knowledge. In the process of constructing knowledge graph, because of the limited annotation of the text resources in the specific fields such as geography, it is hard to apply the large-scale technology such as the deep learning. Based on the transfer learning technology, this project researches how to correlate the semantic relevance between different languages, excavates their shared latent spaces and extracts the entity and entity relationship in geography field by using of the ordinary text resources to construct the knowledge graph. For the work of knowledge graph completion and reasoning, the traditional triple network cannot be effective in the representation of semantic association between entities, and its computational efficiency is low. Based on the distributed representation learning technique, this project will build a fusion model with knowledge graph structure and semantic vector to represent the knowledge graph. It will achieve the accurate prediction for the entity and relationship. The research of this project will help to improve the quality and level of knowledge graph construction in specific fields, promote the application of deep learning in natural language and improve the development of humanoid intelligence level.

知识图谱构建技术是类人智能发展的重要基础。本课题拟针对以地理为代表的特有领域知识图谱构建任务，围绕跨语言处理多潜在空间领域适应性、分布式知识表示等科学问题开展研究工作。在地理等特有领域知识图谱构建过程中，由于其有限的样本标注资源，难以应用深度学习等大规模知识图谱构建技术，本课题基于迁移学习技术，研究不同领域语言之间的语义相关性，挖掘其共享潜在空间，利用普通自然文本资源，提取地理领域实体和实体关系，为知识图谱构建提供基础；在知识图谱补全和推理方面，传统三元组的网络表示形式不能有效的度量和利用实体间的语义关系，计算效率低下，本课题基于分布式表示学习技术，建立图结构与向量空间融合的表示学习方法，实现实体和关系的精确预测。本项目的研究有助于提高特有领域知识图谱构建质量和水平，推动深度学习在自然语言中的应用和促进类人智能水平的发展。

项目摘要

从地理领域文本等非结构化数据中抽取实体和关系，构建知识图谱，为智能问答等应用提供了重要基础。本课题针对以地理为代表的特有领域知识图谱构建任务，围绕跨语言处理多潜在空间领域适应性、分布式知识表示等科学问题开展研究工作。针对地理概念关系语料缺乏的问题，提出了基于LSTM的迁移学习方法，该方法将开放领域的知识迁移到地理领域，辅助地理领域更准确地完成概念关系抽取；在实体关系抽取中提出了针对概率分布适应权重的估计方法，自适应地调整边缘和条件概率分布在适应过程中的学习权重，提升领域适应能力；应用图注意力网络学习知识库中显式关联性知识和结构信息，并对地理领域语料库中的实体进行表示增强；构建了一种基于可信度向量的知识图谱表示学习模型，提高模型对实体的区分能力。本课题通过三年的研究工作，按照原计划开展了研究，并取得了预期的成果，完成了预期目标。获得王选新闻科学技术奖一等奖1项；项目负责人段鹏飞在澳大利亚昆士兰大学访学1年，参加国际学术会议2次，大会报告2次；在国内外期刊及国际会议论文集上发表论文8篇；申请国家发明专利2项，获批软件著作权2项；培养硕士研究生4人，团队1名成员晋升为副教授。还有一些研究成果正在整理，在未来2-3年内将继续发布相关学术论文。本项目的研究有助于提高特有领域知识图谱构建质量和水平，推动深度学习在自然语言中的应用和促进类人智能水平的发展。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：10.3969/j.issn.1001-1978.2022.02.019

发表时间：2022

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：10.11897/SP.J.1016.2018.00886

发表时间：2018

DOI：

发表时间：2018

段鹏飞的其他基金

批准号：31501260

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：91856115

批准年份：2018

资助金额：75.00

项目类别：重大研究计划

批准号：11405076

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：11347101

批准年份：2013

资助金额：5.00

项目类别：专项基金项目

相似国自然基金

面向特定领域的知识图谱构建与应用关键技术研究

批准号：U1836118

批准年份：2018

负责人：程军军

学科分类：F0606

资助金额：65.00

项目类别：联合基金项目

矿床领域文本数据挖掘与知识图谱构建

批准号：41902305

批准年份：2019

负责人：王成彬

学科分类：D0215

资助金额：27.00

项目类别：青年科学基金项目

强化学习框架下的知识图谱构建技术研究

批准号：61902417

批准年份：2019

负责人：谭真

学科分类：F0211

资助金额：33.00

项目类别：青年科学基金项目

基于知识迁移的跨领域人体动作识别

批准号：61403417

批准年份：2014

负责人：刘佳

学科分类：F0304

资助金额：25.00

项目类别：青年科学基金项目

基于迁移学习的地理领域知识图谱构建技术

{{i.achievement_title}}

暂无此项成果

其他相关文献

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

TRPV1/SIRT1介导吴茱萸次碱抗Ang Ⅱ诱导的血管平滑肌细胞衰老

现代优化理论与应用

WMTL-代数中的蕴涵滤子及其应用

相关系数SVD增强随机共振的单向阀故障诊断

段鹏飞的其他基金

冠菌素调控玉米苗期根系响应干旱胁迫的生理机制

自组装体系中的手性多步传递、放大与圆偏振发光增强效应

LHC和超高能强子对撞机上顶夸克与规范粒子或Higgs耦合特性的精确研究

LHC上Higgs耦合特性研究中的新物理探索

相似国自然基金