基于深度神经网络的实体关系抽取关键技术研究

基本信息
批准号:61602059
项目类别:青年科学基金项目
资助金额:20.00
负责人:曾道建
学科分类:
依托单位:长沙理工大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:李峰,李文军,桂彦,喻一凡,曾浚芯,杨程,刘杨
关键词:
深度神经网络非结构化文本实体关系抽取
结项摘要

As a core technology of automatically building large-scale knowledge base, entity relation extraction is of great significance to the development of artificial intelligence. The rapid development of the deep neural network brings new ideas to entity relation extraction. This application mainly solves the shortcomings of the traditional entity relation extraction method. The goal of this application is to build a large-scale knowledge base which is rapidly updated. We study the key methods for entity relation extraction from unstructured texts based on the deep neural network. The main tasks includes: 1) Aiming at the poor robustness of traditional features, we study entity relation extraction method based on deep neural network. A deep neural network is proposed to automatically learn more robust features. This procedure is as independent from existing Natural Language Processing (NLP) tools as possible. 2) Aiming at the wrong label problem in the Distant Supervision for Relation Extraction method, we study to solve this problem in the entity relation extraction method that is based on deep neural network. 3) Aiming at the limitation of learning expert knowledge using deep neural network, we study to leverage multi resource in order to improve the performance of entity relation extraction. The achievements of this project will provide some valuable suggestion for natural language understanding and deep web information computation.

作为自动构建大规模知识库的一项核心技术,实体关系抽取对人工智能的发展有着重要的意义。深度神经网络的快速发展为实体关系抽取带来了新的思路,本申请课题针对传统实体关系抽取方法存在的缺点,以构建大规模的、快速更新的知识库为目标,以非结构化文本为抽取对象,研究基于深度神经网络的实体关系抽取中的关键技术,具体研究内容包括:1)针对传统特征鲁棒性较差,研究使用深度神经网络进行实体关系抽取方法,通过深度神经网络自动学习更具鲁棒性的特征,尽可能少地依赖现有的自然语言处理工具;2)针对弱监督实体关系抽取方法存在数据回标噪声,研究怎样在基于深度神经网络的实体关系抽取框架下解决此问题;3)针对深度神经网络对于专家知识的自动学习能力有限,研究怎样进行多源信息融合以提升实体关系抽取的效果。本申请课题的研究成果将为自然语言理解、互联网信息深度计算等提供参考。

项目摘要

作为自动构建大规模知识库的一项核心技术,实体关系抽取对人工智能的发展有着重要的意义。深度神经网络的快速发展为实体关系抽取带来了新的思路,本项目针对传统实体关系抽取方法存在的缺点,以构建大规模的、快速更新的知识库为目标,以非结构化文本为抽取对象,研究基于深度神经网络的实体关系抽取中的关键技术,具体研究内容包括:1)针对传统特征鲁棒性较差,研究使用深度神经网络进行实体关系抽取方法,通过深度神经网络自动学习更具鲁棒性的特征,尽可能少地依赖现有的自然语言处理工具。2)针对弱监督实体关系抽取方法存在数据回标噪声,研究怎样在基于深度神经网络的实体关系抽取框架下解决此问题。3)针对深度神经网络对于专家知识的自动学习能力有限,研究怎样进行多源信息融合以提升实体关系抽取的效果。在资助期间,这三点研究计划均取得一定成果,通过对这三点的研究,实体关系抽取性能有了较大的提升。具体地,课题组提出基于代价敏感和排序损失的弱监督实体关系抽取方法,使用代价敏感来解决弱监督实体关系抽取存在的数据不均衡问题。提出了使用生成对抗网络提升弱监督实体关系抽取的性能,自动生成高质量的负样本。探讨实体关系联合抽取方法,并进行了初步尝试,取得了较好的效果。本课题解决了从非结构化文本中进行实体关系学习、大规模复杂网络知识的深度挖掘和多源异构知识融合的问题。整体来看,通过三年的努力,已完成项目目标。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
4

多源数据驱动CNN-GRU模型的公交客流量分类预测

多源数据驱动CNN-GRU模型的公交客流量分类预测

DOI:10.19818/j.cnki.1671-1637.2021.05.022
发表时间:2021
5

Wnt 信号通路在非小细胞肺癌中的研究进展

Wnt 信号通路在非小细胞肺癌中的研究进展

DOI:
发表时间:2016

曾道建的其他基金

相似国自然基金

1

基于知识库和深度学习的生物医学实体关系抽取研究

批准号:61772109
批准年份:2017
负责人:周惠巍
学科分类:F0211
资助金额:63.00
项目类别:面上项目
2

藏文实体语义关系抽取理论与方法研究

批准号:61262054
批准年份:2012
负责人:于洪志
学科分类:F0211
资助金额:43.00
项目类别:地区科学基金项目
3

基于树核函数的弱指导实体间语义关系抽取研究

批准号:60873150
批准年份:2008
负责人:周国栋
学科分类:F0211
资助金额:30.00
项目类别:面上项目
4

开放获取生物医学文献的实体关系抽取

批准号:61602207
批准年份:2016
负责人:丰小月
学科分类:F0607
资助金额:20.00
项目类别:青年科学基金项目