As a core technology of automatically building large-scale knowledge base, entity relation extraction is of great significance to the development of artificial intelligence. The rapid development of the deep neural network brings new ideas to entity relation extraction. This application mainly solves the shortcomings of the traditional entity relation extraction method. The goal of this application is to build a large-scale knowledge base which is rapidly updated. We study the key methods for entity relation extraction from unstructured texts based on the deep neural network. The main tasks includes: 1) Aiming at the poor robustness of traditional features, we study entity relation extraction method based on deep neural network. A deep neural network is proposed to automatically learn more robust features. This procedure is as independent from existing Natural Language Processing (NLP) tools as possible. 2) Aiming at the wrong label problem in the Distant Supervision for Relation Extraction method, we study to solve this problem in the entity relation extraction method that is based on deep neural network. 3) Aiming at the limitation of learning expert knowledge using deep neural network, we study to leverage multi resource in order to improve the performance of entity relation extraction. The achievements of this project will provide some valuable suggestion for natural language understanding and deep web information computation.
作为自动构建大规模知识库的一项核心技术,实体关系抽取对人工智能的发展有着重要的意义。深度神经网络的快速发展为实体关系抽取带来了新的思路,本申请课题针对传统实体关系抽取方法存在的缺点,以构建大规模的、快速更新的知识库为目标,以非结构化文本为抽取对象,研究基于深度神经网络的实体关系抽取中的关键技术,具体研究内容包括:1)针对传统特征鲁棒性较差,研究使用深度神经网络进行实体关系抽取方法,通过深度神经网络自动学习更具鲁棒性的特征,尽可能少地依赖现有的自然语言处理工具;2)针对弱监督实体关系抽取方法存在数据回标噪声,研究怎样在基于深度神经网络的实体关系抽取框架下解决此问题;3)针对深度神经网络对于专家知识的自动学习能力有限,研究怎样进行多源信息融合以提升实体关系抽取的效果。本申请课题的研究成果将为自然语言理解、互联网信息深度计算等提供参考。
作为自动构建大规模知识库的一项核心技术,实体关系抽取对人工智能的发展有着重要的意义。深度神经网络的快速发展为实体关系抽取带来了新的思路,本项目针对传统实体关系抽取方法存在的缺点,以构建大规模的、快速更新的知识库为目标,以非结构化文本为抽取对象,研究基于深度神经网络的实体关系抽取中的关键技术,具体研究内容包括:1)针对传统特征鲁棒性较差,研究使用深度神经网络进行实体关系抽取方法,通过深度神经网络自动学习更具鲁棒性的特征,尽可能少地依赖现有的自然语言处理工具。2)针对弱监督实体关系抽取方法存在数据回标噪声,研究怎样在基于深度神经网络的实体关系抽取框架下解决此问题。3)针对深度神经网络对于专家知识的自动学习能力有限,研究怎样进行多源信息融合以提升实体关系抽取的效果。在资助期间,这三点研究计划均取得一定成果,通过对这三点的研究,实体关系抽取性能有了较大的提升。具体地,课题组提出基于代价敏感和排序损失的弱监督实体关系抽取方法,使用代价敏感来解决弱监督实体关系抽取存在的数据不均衡问题。提出了使用生成对抗网络提升弱监督实体关系抽取的性能,自动生成高质量的负样本。探讨实体关系联合抽取方法,并进行了初步尝试,取得了较好的效果。本课题解决了从非结构化文本中进行实体关系学习、大规模复杂网络知识的深度挖掘和多源异构知识融合的问题。整体来看,通过三年的努力,已完成项目目标。
{{i.achievement_title}}
数据更新时间:2023-05-31
低轨卫星通信信道分配策略
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
多源数据驱动CNN-GRU模型的公交客流量分类预测
Wnt 信号通路在非小细胞肺癌中的研究进展
基于知识库和深度学习的生物医学实体关系抽取研究
藏文实体语义关系抽取理论与方法研究
基于树核函数的弱指导实体间语义关系抽取研究
开放获取生物医学文献的实体关系抽取