基于动作概念的本体知识库及在文本处理上的应用

基本信息
批准号:61373031
项目类别:面上项目
资助金额:75.00
负责人:朱其立
学科分类:
依托单位:上海交通大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:姚斌,蔡小娟,罗康琦,贾枭,罗志一,方文静,王鹏程,蔡智源,姜凯
关键词:
本体知识库概念文本处理文本理解动作
结项摘要

Much valuable information is hidden in the trove of massive natural language text data both online and offline. Knowledge is indispensible in understanding text. In the past, in addition to lexicons and thesauri, noun-based taxonomies or ontologies have been constructed either manually or automatically to support natural language processing. However, nouns or noun phrases alone are not sufficient to understand human text because verbs, and more generally, actions are central to the semantics of sentences. Recent research on semantic role labeling (SRL) seeks to automatically detect the senses of the verbs and their arguments, but the approach relies heavily on manually curated frame corpus and does not scale well. In this project, we propose to study the theory of action concepts, and to develop a framework for automatically construct an action-centric concept ontology from large-scale web text data. This ontology captures action semantics that is more fine-grained and more general that is available from SRL. We also propose to develop a way to automatically map an action into a noun-based concept, in a process called action conceptualization. To demonstrate the usefulness and effectiveness of the proposed ontology, we will develop a number of well-known text processing applications which are all powered by the new technology.

海量的线上和线下自然语言文本数据中蕴藏着非常有价值的信息。知识是理解和处理文本数据的关键。过去,人们用手工或自动的方法构建了词典、词库和基于名词的分类知识库或本体知识库。但是仅靠名词和名词短语来理解文本是不够的。这是因为动词或广义上的动作在每个语句的语义中都起着关键作用。近年来语义角色标注(SRL)的研究试图自动地监测出语句中动词和它的参数的含义,但是这些监督式学习方法依赖人工编纂的语料,故而难以扩展。本项目中我们将谓语动词和动作看作一种概念,研究动作概念的理论以及如何从海量互联网数据上自动提取并构建一个以动作为中心的本体概念知识库。这一知识库可以掌握比SRL更细粒度、更广泛的动作语义。我们还将设计一种把动作自动映射到一个名词概念上的方法。这一过程被称为动作概念化。最后我们将在这些新技术的基础上开发若干经典文本处理应用,以展示动作概念知识库的用途和性能。

项目摘要

海量的线上和线下自然语言文本数据中蕴藏着非常有价值的信息。知识是理解和处理文本数据的关键。过去,人们用手工或自动的方法构建了词典、词库和基于名词的分类知识库或本体知识库。但是仅靠名词和名词短语来理解文本是不够的。这是因为动词或广义上的动作在每个语句的语义中都起着关键作用。近年来语义角色标注(SRL)的研究试图自动地监测出语句中动词和它的参数的含义,但是这些监督式学习方法依赖人工编纂的语料,故而难以扩展。本项目中我们将谓语动词和动作看作一种概念,研究动作概念的理论以及如何从海量互联网数据上自动提取并构建一个以动作为中心的本体概念知识库。这一知识库可以掌握比SRL更细粒度、更广泛的动作语义。我们还设计一种把动作自动映射到一个名词概念上的方法。这一过程被称为动作概念化。最后我们将在这些新技术的基础上开发若干经典文本处理应用,以展示动作概念知识库的用途和性能。在本项目中,我们对数千个英文动词的参数作了概念化处理,并获得相当高准确度的参数概念集合。这项成果发表在AAAI 2016,并公开了我们的数据集和开源代码。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于综合治理和水文模型的广西县域石漠化小流域区划研究

基于综合治理和水文模型的广西县域石漠化小流域区划研究

DOI:10.14050/j.cnki.1672-9250.2017.02.014
发表时间:2017
2

基于直观图的三支概念获取及属性特征分析

基于直观图的三支概念获取及属性特征分析

DOI:10.3778/j.issn.1673-9418.2104120
发表时间:
3

A Fast Algorithm for Computing Dominance Classes

A Fast Algorithm for Computing Dominance Classes

DOI:
发表时间:2016
4

基于可能属性分析的粒描述

基于可能属性分析的粒描述

DOI:10. 6040 /j. issn. 1671-9352. 4. 2020. 149
发表时间:2021
5

基于关系对齐的汉语虚词抽象语义表示与分析

基于关系对齐的汉语虚词抽象语义表示与分析

DOI:
发表时间:2020

朱其立的其他基金

批准号:61100050
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目

相似国自然基金

1

基于主题形式概念分析的文本处理关键技术研究

批准号:61502033
批准年份:2015
负责人:施重阳
学科分类:F0607
资助金额:20.00
项目类别:青年科学基金项目
2

基于语义网络的肾系疾病古籍本体知识库构建及方证规律挖掘

批准号:81603717
批准年份:2016
负责人:张蕾
学科分类:H3121
资助金额:17.00
项目类别:青年科学基金项目
3

基于Wiki资源的中英文跨语言本体知识库构建

批准号:61202246
批准年份:2012
负责人:王志春
学科分类:F06
资助金额:24.00
项目类别:青年科学基金项目
4

基于形式概念分析的描述逻辑本体构建理论与方法

批准号:61272066
批准年份:2012
负责人:蒋运承
学科分类:F0201
资助金额:80.00
项目类别:面上项目