The event is the main form for people to experience and cognize the world. Event information extraction is the key method and one of the most difficult tasks in the field of information extraction. This application mainly solves the shortcomings of the traditional event information extraction method. The goal of this application is to support building a large scale knowledge base which is rapidly updated. We study the key methods for event information extraction from unstructured texts based on the deep neural network. The main tasks include: 1) Aiming at the problem that traditional event extraction methods extract events separately by only using sentence-level information, we study the collective event extraction method via using sentence-level information and document-level information jointly. 2) Aiming at the problem that labelling data manually is a time-consuming and high cost of the process, we propose to automatically label training data for event extraction via world knowledge and linguistic knowledge, and propose a neural-based method to solve the noise problem in automatically labelled data. 3) Aiming at the problem there are few research on event relation extraction and they only use the symbolic feature of texts, we study the event causal relation extraction via using the background knowledge in knowledge graph and numerical representation of text jointly. 4) Developing an event information extraction platform for unstructured texts and an event knowledge graph prototype system. The achievements of this project will provide valuable suggestion and reference for the understanding of text semantics and the linking of large scale knowledge.
事件是人们体验和认知世界的主要形式,事件信息抽取是信息抽取中的关键技术和难点问题。本申请项目针对传统事件信息抽取方法存在的不足,以支持构建大规模、快速更新的事件知识图谱为目标,以非结构化文本为抽取对象,研究基于深度神经网络的事件信息抽取关键技术,具体研究内容包括:1)针对传统方法仅利用句子级信息独立抽取多个事件的问题,研究融合句子信息和篇章信息的多事件协同抽取方法;2)针对人工标注语料耗时、费力、成本高昂的问题,研究基于世界知识和语言学知识的事件语料大规模自动生成方法和含噪数据下的事件抽取方法;3)针对事件关系抽取研究较少和现有工作仅利用符号化文本语义进行事件关系抽取的问题,研究融合知识图谱和数值化文本语义的事件因果关系抽取方法;4)在上述研究基础上,研制面向非结构化文本的事件信息抽取平台并建立事件知识图谱原型系统。本申请项目的研究成果将为文本语义理解和海量知识互联提供借鉴和参考。
本项目针对传统事件信息抽取方法存在的不足,以支持构建大规模、快速更新的事件知识图谱为目标,以非结构化文本为抽取对象,研究基于深度神经网络的事件信息抽取关键技术,具体研究内容包括:(1)针对传统方法仅利用句子级信息独立抽取多个事件的问题,研究融合句子信息和篇章信息的多事件协同抽取方法;(2)针对人工标注语料耗时、费力、成本高昂的问题,研究基于世界知识和语言学知识的事件语料大规模自动生成方法和含噪数据下的事件抽取方法;(3)针对事件关系抽取研究较少和现有工作仅利用符号化文本语义进行事件关系抽取的问题,研究融合知识图谱和数值化文本语义的事件因果关系抽取方法;(4)在上述研究基础上,研制面向非结构化文本的事件信息抽取平台并建立事件知识图谱原型系统。主要研究成果包括:(1)在学术成果方面:在国内外重要学术会议和期刊上共发表论文35篇,其中国际学术期刊和会议上共发表论文27篇,国内学术期刊和会议上发表论文8篇,CCF A类11篇, CCF B类13篇,申请发明专利10项,授权4项;(2)基础资源方面:构建了开放、链接的大规模知识图谱一个(以事件为核心的大规模多元知识图谱CogNet-1.0);(3)系统和评测方面:构建了多元知识抽取系统1个,参加国内外相关评测4个并获得优异成绩,构建事件抽取、事件关系抽取、过程知识抽取数据集7个,并组织系列评测2个;(4)学术奖励方面:获得北京市科学技术进步奖一等奖1项、课题负责人入选第五届中国科协青年人才托举工程和2022年度中国科学院青年创新促进会会员、获得最佳论文奖2项。本项目的研究成果可为在线教育、智慧医疗、智能金融、智慧通信等重大应用提供核心技术支撑。
{{i.achievement_title}}
数据更新时间:2023-05-31
服务经济时代新动能将由技术和服务共同驱动
基于图卷积网络的归纳式微博谣言检测新方法
卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比
知识产权保护执法力度、技术创新与企业绩效 — 来自中国上市公司的证据
基于关系对齐的汉语虚词抽象语义表示与分析
医疗对话文本中的信息抽取关键技术研究
基于维语网络文本的事件抽取方法研究
基于篇章特征的越南语新闻事件信息抽取关键技术研究
面向大规模分布式内存的非结构化数据管理系统关键技术研究