The technology of knowledge graph construction is an important foundation for humanoid intelligence development. This project focuses on the work of knowledge graph construction in specific fields represented by geography, carries out research work on natural language processing with scientific issues such as adaptability of transfer learning and distributed representation of knowledge. In the process of constructing knowledge graph, because of the limited annotation of the text resources in the specific fields such as geography, it is hard to apply the large-scale technology such as the deep learning. Based on the transfer learning technology, this project researches how to correlate the semantic relevance between different languages, excavates their shared latent spaces and extracts the entity and entity relationship in geography field by using of the ordinary text resources to construct the knowledge graph. For the work of knowledge graph completion and reasoning, the traditional triple network cannot be effective in the representation of semantic association between entities, and its computational efficiency is low. Based on the distributed representation learning technique, this project will build a fusion model with knowledge graph structure and semantic vector to represent the knowledge graph. It will achieve the accurate prediction for the entity and relationship. The research of this project will help to improve the quality and level of knowledge graph construction in specific fields, promote the application of deep learning in natural language and improve the development of humanoid intelligence level.
知识图谱构建技术是类人智能发展的重要基础。本课题拟针对以地理为代表的特有领域知识图谱构建任务,围绕跨语言处理多潜在空间领域适应性、分布式知识表示等科学问题开展研究工作。在地理等特有领域知识图谱构建过程中,由于其有限的样本标注资源,难以应用深度学习等大规模知识图谱构建技术,本课题基于迁移学习技术,研究不同领域语言之间的语义相关性,挖掘其共享潜在空间,利用普通自然文本资源,提取地理领域实体和实体关系,为知识图谱构建提供基础;在知识图谱补全和推理方面,传统三元组的网络表示形式不能有效的度量和利用实体间的语义关系,计算效率低下,本课题基于分布式表示学习技术,建立图结构与向量空间融合的表示学习方法,实现实体和关系的精确预测。本项目的研究有助于提高特有领域知识图谱构建质量和水平,推动深度学习在自然语言中的应用和促进类人智能水平的发展。
从地理领域文本等非结构化数据中抽取实体和关系,构建知识图谱,为智能问答等应用提供了重要基础。本课题针对以地理为代表的特有领域知识图谱构建任务,围绕跨语言处理多潜在空间领域适应性、分布式知识表示等科学问题开展研究工作。针对地理概念关系语料缺乏的问题,提出了基于LSTM的迁移学习方法,该方法将开放领域的知识迁移到地理领域,辅助地理领域更准确地完成概念关系抽取;在实体关系抽取中提出了针对概率分布适应权重的估计方法,自适应地调整边缘和条件概率分布在适应过程中的学习权重,提升领域适应能力;应用图注意力网络学习知识库中显式关联性知识和结构信息,并对地理领域语料库中的实体进行表示增强;构建了一种基于可信度向量的知识图谱表示学习模型,提高模型对实体的区分能力。本课题通过三年的研究工作,按照原计划开展了研究,并取得了预期的成果,完成了预期目标。获得王选新闻科学技术奖一等奖1项;项目负责人段鹏飞在澳大利亚昆士兰大学访学1年,参加国际学术会议2次,大会报告2次;在国内外期刊及国际会议论文集上发表论文8篇;申请国家发明专利2项,获批软件著作权2项;培养硕士研究生4人,团队1名成员晋升为副教授。还有一些研究成果正在整理,在未来2-3年内将继续发布相关学术论文。本项目的研究有助于提高特有领域知识图谱构建质量和水平,推动深度学习在自然语言中的应用和促进类人智能水平的发展。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
一种改进的多目标正余弦优化算法
面向工件表面缺陷的无监督域适应方法
面向特定领域的知识图谱构建与应用关键技术研究
矿床领域文本数据挖掘与知识图谱构建
强化学习框架下的知识图谱构建技术研究
基于知识迁移的跨领域人体动作识别