句法制导的统计汉语句义分析方法研究

基本信息
批准号:60975054
项目类别:面上项目
资助金额:30.00
负责人:常宝宝
学科分类:
依托单位:北京大学
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:詹卫东,丁伟伟,朱丹青,郑晓东,杜田桑,杨敏
关键词:
句法制导句法语义分析结构化支持向量机浅层句义分析
结项摘要

自然语言理解的核心是语义的理解,长期以来,缺乏健壮可靠的语义分析技术一直是制约各类自然语言处理应用系统性能提高的瓶颈之一。浅层句义分析主要着眼于提取句子中谓词与其他成分之间的语义关系,是现阶段句义分析研究的现实选择,目前典型的方法是将浅层句义分析视作一种后句法的非结构化分类问题,谓词论元以及谓词框架间所形成的结构关系在模型中不能很好的体现,同时也不易实现与句法分析的融合和集成。针对这些问题,在本项目中,我们提出了一种句法制导的统计汉语句义分析方法;并将结构化支持向量机模型用于浅层句义分析建模问题,以期更好地在模型中刻画浅层分析结果中所展现出的结构依存关系;基于句法制导机制,我们还提出了建立句法语义分析的一体化模型,以期在句法分析模型和句义分析模型互动的基础上综合提升二者的分析性能。

项目摘要

自然语言理解的核心是语义的理解,长期以来,缺乏健壮可靠的语义分析技术一直是制约各类自然语言处理应用系统性能提高的瓶颈之一。本项目主要围绕汉语浅层句义分析展开,重点研究下面6项内容并取得积极进展:.(1) 提出了一种句法制导的浅层句义分析模型,该模型使得浅层句义分析具有更好的形式语义学基础,不同于目前所提出的其他浅层句义分析方法。.(2) 提出了一种基于语义组块的浅层句义分析方法,在词的基础上直接对语义角色进行识别和分类,获得了较高的准确率,并极大地节省了分析时间。.(3) 基于北大网库(NetBank)构建了一个语义角色分类系统,并将其与基于PropBank的语义角色分类系统的性能进行了对比,探讨了不同的语义标注体系对浅层句义分析方法的影响。.(4) 将半指导的机器学习技术用于汉语浅层句义分析,除了使用标注语料之外,还将未标注语料加入模型训练过程,弥补了标注语料在规模和领域覆盖方面的不足,改善了句义分析技术的领域推广能力。.(5) 对汉语分词模型的领域适应性进行了考察,汉语分词是汉语语义角色的前处理工作,分词性能对浅层句义分析的性能有着直接的影响,项目组通过引入多种统计量特征以及半指导学习技术,改善了分词性能和领域适应性。.(6) 构建了浅层句义分析软件和辅助语义角色标记和校对工具。对给定的句法分析树,浅层句义分析软件可以完成句子中谓词的语义角色。辅助语义角色标注软件则可以可视化的界面辅助人工完成语义角色标注任务。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:
2

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

DOI:10.11842/wst.20190724002
发表时间:2020
3

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

高分五号卫星多角度偏振相机最优化估计反演:角度依赖与后验误差分析

DOI:10.7498/aps.68.20181682
发表时间:2019
4

铁路大跨度简支钢桁梁桥车-桥耦合振动研究

铁路大跨度简支钢桁梁桥车-桥耦合振动研究

DOI:10.3969/j.issn.1000-0844.2017.05.0820
发表时间:2017
5

基于暂态波形相关性的配电网故障定位方法

基于暂态波形相关性的配电网故障定位方法

DOI:10.7500/aeps20191122006
发表时间:2020

常宝宝的其他基金

批准号:61273318
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:60303003
批准年份:2003
资助金额:24.00
项目类别:青年科学基金项目
批准号:61876004
批准年份:2018
资助金额:62.00
项目类别:面上项目

相似国自然基金

1

基于枢轴语言的汉越句法统计翻译方法研究

批准号:61672271
批准年份:2016
负责人:余正涛
学科分类:F0211
资助金额:61.00
项目类别:面上项目
2

GPSG理论用于汉语语句的句法分析的研究

批准号:68773035
批准年份:1987
负责人:戴大为
学科分类:F0211
资助金额:2.00
项目类别:面上项目
3

汉语句法排歧知识的自动获取方法研究

批准号:69705005
批准年份:1997
负责人:孙茂松
学科分类:F03
资助金额:12.00
项目类别:青年科学基金项目
4

基于深层学习的汉语句法语义分析研究

批准号:61273318
批准年份:2012
负责人:常宝宝
学科分类:F03
资助金额:80.00
项目类别:面上项目