基于迁移学习的地理领域知识图谱构建技术

基本信息
批准号:61702386
项目类别:青年科学基金项目
资助金额:24.00
负责人:段鹏飞
学科分类:
依托单位:武汉理工大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:熊盛武,解庆,DAHOU ABDELGHANI,张小红,毛晶晶,陈振东
关键词:
迁移学习实体关系抽取表示学习
结项摘要

The technology of knowledge graph construction is an important foundation for humanoid intelligence development. This project focuses on the work of knowledge graph construction in specific fields represented by geography, carries out research work on natural language processing with scientific issues such as adaptability of transfer learning and distributed representation of knowledge. In the process of constructing knowledge graph, because of the limited annotation of the text resources in the specific fields such as geography, it is hard to apply the large-scale technology such as the deep learning. Based on the transfer learning technology, this project researches how to correlate the semantic relevance between different languages, excavates their shared latent spaces and extracts the entity and entity relationship in geography field by using of the ordinary text resources to construct the knowledge graph. For the work of knowledge graph completion and reasoning, the traditional triple network cannot be effective in the representation of semantic association between entities, and its computational efficiency is low. Based on the distributed representation learning technique, this project will build a fusion model with knowledge graph structure and semantic vector to represent the knowledge graph. It will achieve the accurate prediction for the entity and relationship. The research of this project will help to improve the quality and level of knowledge graph construction in specific fields, promote the application of deep learning in natural language and improve the development of humanoid intelligence level.

知识图谱构建技术是类人智能发展的重要基础。本课题拟针对以地理为代表的特有领域知识图谱构建任务,围绕跨语言处理多潜在空间领域适应性、分布式知识表示等科学问题开展研究工作。在地理等特有领域知识图谱构建过程中,由于其有限的样本标注资源,难以应用深度学习等大规模知识图谱构建技术,本课题基于迁移学习技术,研究不同领域语言之间的语义相关性,挖掘其共享潜在空间,利用普通自然文本资源,提取地理领域实体和实体关系,为知识图谱构建提供基础;在知识图谱补全和推理方面,传统三元组的网络表示形式不能有效的度量和利用实体间的语义关系,计算效率低下,本课题基于分布式表示学习技术,建立图结构与向量空间融合的表示学习方法,实现实体和关系的精确预测。本项目的研究有助于提高特有领域知识图谱构建质量和水平,推动深度学习在自然语言中的应用和促进类人智能水平的发展。

项目摘要

从地理领域文本等非结构化数据中抽取实体和关系,构建知识图谱,为智能问答等应用提供了重要基础。本课题针对以地理为代表的特有领域知识图谱构建任务,围绕跨语言处理多潜在空间领域适应性、分布式知识表示等科学问题开展研究工作。针对地理概念关系语料缺乏的问题,提出了基于LSTM的迁移学习方法,该方法将开放领域的知识迁移到地理领域,辅助地理领域更准确地完成概念关系抽取;在实体关系抽取中提出了针对概率分布适应权重的估计方法,自适应地调整边缘和条件概率分布在适应过程中的学习权重,提升领域适应能力;应用图注意力网络学习知识库中显式关联性知识和结构信息,并对地理领域语料库中的实体进行表示增强;构建了一种基于可信度向量的知识图谱表示学习模型,提高模型对实体的区分能力。本课题通过三年的研究工作,按照原计划开展了研究,并取得了预期的成果,完成了预期目标。获得王选新闻科学技术奖一等奖1项;项目负责人段鹏飞在澳大利亚昆士兰大学访学1年,参加国际学术会议2次,大会报告2次;在国内外期刊及国际会议论文集上发表论文8篇;申请国家发明专利2项,获批软件著作权2项;培养硕士研究生4人,团队1名成员晋升为副教授。还有一些研究成果正在整理,在未来2-3年内将继续发布相关学术论文。本项目的研究有助于提高特有领域知识图谱构建质量和水平,推动深度学习在自然语言中的应用和促进类人智能水平的发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
3

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
4

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019
5

面向工件表面缺陷的无监督域适应方法

面向工件表面缺陷的无监督域适应方法

DOI:
发表时间:2021

段鹏飞的其他基金

批准号:31501260
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:91856115
批准年份:2018
资助金额:75.00
项目类别:重大研究计划
批准号:11405076
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:11347101
批准年份:2013
资助金额:5.00
项目类别:专项基金项目

相似国自然基金

1

面向特定领域的知识图谱构建与应用关键技术研究

批准号:U1836118
批准年份:2018
负责人:程军军
学科分类:F0606
资助金额:65.00
项目类别:联合基金项目
2

矿床领域文本数据挖掘与知识图谱构建

批准号:41902305
批准年份:2019
负责人:王成彬
学科分类:D0215
资助金额:27.00
项目类别:青年科学基金项目
3

强化学习框架下的知识图谱构建技术研究

批准号:61902417
批准年份:2019
负责人:谭真
学科分类:F0211
资助金额:33.00
项目类别:青年科学基金项目
4

基于知识迁移的跨领域人体动作识别

批准号:61403417
批准年份:2014
负责人:刘佳
学科分类:F0304
资助金额:25.00
项目类别:青年科学基金项目