All predicates of a sentence convey the whole semantics of the sentence together. But, the current approaches to Semantic Role Labeling (SRL) usually perform role classifications for each predicate separately but ignore the semantic interaction among all the predicates, which cause much useful structure and semantic information on sentence level missing and finally make the performance of SRL system dramatically decline. Therefore, in order to solve the problem, we propose a series of corresponding methods and the main contents of this proposal include: 1) study on a novel framework on sentence-level to do SRL, taking into account the semantic interaction among multiple predicates in a sentence; 2) study on a global inference method under the above framework, ensuring the global optimal result with consistent outputs; 3) study on the sparse predicates and domain migration problem with the help of deep learning to improve the robustness and generalization. The expected research results will enrich current SRL theory from predicate-level to sentence-level and promote the development of related technologies, which has important theoretical significance and practical value.
一个句子中的全部谓词联合起来表达了句子的完整语义。然而,目前主流的语义角色标注方法仍然停留在单个“谓词”层面,忽视了句子中谓词与谓词之间的语义关联,这就导致很多只能在句子层面获取到的结构和语义信息严重缺失,从而使得语义角色标注的准确率急剧下降。因此,本项目紧紧围绕整句层面的语义角色标注展开如下创新性研究:1)研究基于“整句”层面的语义角色标注框架,兼顾考虑句中多个谓词语义角色标注之间的语义关联;2)研究统一框架下的全局推断模型,力保联合标注模型能够输出全局最优、高度一致性的语义标注结果;3)借助深度学习强大的表征和抽象能力,研究稀疏谓词的标注方法和领域迁移方法,提升标注模型的鲁棒性和泛化性。本项目的预期研究成果将使现有的语义角色标注理论从“谓词”层面提升到“整句”层面,该成果将丰富和发展现有的语义角色标注理论方法,并能推动相关技术的发展,具有重要的理论研究意义和实用价值。
目前主流的语义角色标注方法仍然停留在单个“谓词”层面,而忽视了句子中谓词与谓词之间的语义关联。本项目围绕句子层面的语义角色标注进行了深入的研究和探索:(1)提出一种基于图模型的中文多谓词语义角色标注方法,可以利用句中多个谓词之间的全局特征,提升语义角色的区分度,并采用随机爬山算法优化图模型;(2)对于中文中的稀疏谓词,提出基于层次化聚类的稀疏谓词语义角色标注方法,稀疏谓词可以泛化为与之相近的常用谓词,大大缓和了语义角色标注中的稀疏谓词问题;(3)提出了一种基于深度学习的整句语义角色标注方法,通过局部模型生成初始的结果候选,然后通过深度模型框架挖掘整句的语义特征,进而提升语义角色标注的效果,同时语义分析的效率较高;(4)针对语义角色标注中的领域适应问题,提出了基于深度对抗学习的领域适应方法,可以从多个领域的无标注数据中挖掘出学习到统一的特征表示,并将此特征表示输入到深度学习框架中用于分类,可以显著地改善语义角色标注中的领域适应问题。本项目的研究表明整句层次包含着大量有益的信息,合理利用这些信息构建整句级别的语义角色标注方法可以显著地提升语义角色标注的效果。
{{i.achievement_title}}
数据更新时间:2023-05-31
珠江口生物中多氯萘、六氯丁二烯和五氯苯酚的含量水平和分布特征
向日葵种质资源苗期抗旱性鉴定及抗旱指标筛选
复杂系统科学研究进展
基于MCPF算法的列车组合定位应用研究
长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移
汉语框架语义角色自动标注技术研究
中文句法分析与语义角色标注的联合学习机制研究
基于依存句法分析的蒙古语语义角色标注及关键技术研究
汉语语义角色标注方法研究