In the field of the whole Chinese information processing, the collocation between verbs and nouns problem is the core issue of semantic analysis.Most of the previous rules and linguistic theories are for the conventional collocation, followed the"Large Lexicon,Small grammar", while the supernormal collocation often put into Lexicon, which has greatly restricted the development of natural language processing. The supernormal collocation basically has two kinds, one kind is ellipsis, one kind is metaphor.We need to do is according to the Generative Lexicon Theory, to establish a targeted description rules and a knowledge representation system for the supernormal collocation, then to process them. Our work include:(1) the verb as the core, We build a conventional basic collocation base with multiple knowledge sources and propose a Semantic selection restrictions model about conventional collocation incorporating Chinese features.(2),in view of verb ellipsis and noun metaphor problems in the dynamic of the supernormal collocation, we build a Chinese verb library featuring with an event structure of verbs,a metaphor library contains nouns’ qulia roles and semantic class mapping respectively. (3)we introduce the automatic knowledge about the verb ellipsis and noun metaphor into the machine learning framework, to identify the specific supernormal collocation in large-scale corpus.
在整个中文信息处理领域,动词和名词的搭配问题可以说是语义分析的核心问题。以往大部分规则和语言学理论都是围绕常规搭配进行,遵循“大词库、小语法”的思想,对于语法规则之外的一些非常规搭配直接纳入到词库范畴,这就极大的限制了自然语言处理的发展。动名的超常搭配主要有两类,一类是省略,一类是隐喻,我们要做的是根据西方生成词库理论的描述思想,为这些规则之外的动名搭配建立有针对性的描写规则和知识表示体系,然后进行分析和处理。内容包括:(1)以动词为核心,构建常规的动名搭配库,提出符合汉语特色的常规搭配语义选择限制获取模型。(2)针对动名超常搭配中经常出现的谓词省略和名词隐喻问题,分别构建以动词的事件结构为特色的动词资源馆和含有名词物性结构及映射规则的隐喻知识库。(3)把自动获取的谓词隐含和隐喻知识融入到机器学习框架,在大规模的语料中,进行具体的超常搭配识别。
动词和名词的搭配问题是语义分析的核心问题之一。随着研究领域的扩展和深入,学界开始由常规搭配向不规则搭配扩展,而处理思路通常都是遵循“大词库、小语法”的思想,对于语法规则之外的一些非常规搭配直接纳入到词库范畴,这就极大的限制了自然语言处理的发展,并不符合当前的自然语言处理的趋势和要求。本项目吸收了西方生成词库理论,通过描述和构建词项的内在知识表示,来还原和解构超常搭配的组配和生成机制。这样就把把超常搭配的处理过渡到知识库的建设当中。.总体上,我们的研究主要在识别和处理动名超常搭配两个方面:在识别上,我们采用的是通过抽取动词常规语义选择限制条件的方式生成动词的常规搭配优先值,基于此生成动名常规搭配知识库。如果动词所搭配的名词超出了选择性限制条件,则自动判为超常搭配。.在动名超常搭配的处理上,我们根据其内部形成机制,把动名超常搭配划分为隐喻型超常搭配和省略型超常搭配两种。在处理流程上,我们先判断是否属于省略型的超常搭配,然后剩余都按照隐喻型搭配来处理。对于省略型超常搭配,我们主要是通过描述词项的语义角色、事件结构等特征描述来找出超常搭配的省略成分,并进行相应变换和还原;对于隐喻型超常搭配,我们是通过描述词项的隐喻特征以及映射关联来还原超常搭配中常规隐喻对象,从而转化为常规搭配进行处理。这两种方法都是基于大量词项的特征描写上的,为此,本项目很大一部分工作在语义特征的挖掘和表示上。我们采取自动提取和人工标注相结合的方法,并通过构建基于大众智慧的网络平台来提高语义特征的标注质量。.项目组基本按计划开展研究,达到了预期的目标,完成了预定的任务。发表论文共8篇,专著1部,申请专利1项。并且我们对6438个动词义项和19638个名词义项的相关语义特征,进行了深入描述,构建了汉语语义生成知识库。通过这些语义资源的辅助,成功还原和处理汉语动名超常搭配的省略和隐喻问题,基本能够满足常规语义分析的要求。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
地震作用下岩羊村滑坡稳定性与失稳机制研究
卡斯特“网络社会理论”对于人文地理学的知识贡献-基于中外引文内容的分析与对比
平行图像:图像生成的一个新型理论框架
现代汉语形-名和名-名的语义组合模型研究
面向语义检索的汉语名名组合自动释义研究
汉语动词搭配知识的自动发现研究
汉语语音处理方法及其ASIC的结构研究