面向短文本理解的带约束语义文法自动学习方法研究

基本信息
批准号:61702234
项目类别:青年科学基金项目
资助金额:21.00
负责人:王东升
学科分类:
依托单位:江苏科技大学
批准年份:2017
结题年份:2020
起止时间:2018-01-01 - 2020-12-31
项目状态: 已结题
项目参与者:王卫民,陈向坚,诸峰,张健,唐洋
关键词:
短文本理解语义解析文法学习文法评价约束学习
结项摘要

Short texts understanding is crucial to many applications, such as speech understanding, semantic search etc. Short texts have some unique characteristics such as not always observing the syntax of written texts, less context and more ambiguous, which make them difficult to handle. Upon an existing natural language understanding system based on domain ontology and constrained semantic grammar, this research is to further study and realize the method of automatic learning of constrained semantic grammar. Firstly, a semantic grammar rule extending algorithm will be studied to solve domain coverage problem, which first partially parses the (ungrammatical) sentences based on the core semantic grammar, and attempts to build a complete parse tree, including predicting the top-level node of the partial parsing tree, generating and abstracting to learn new grammar rules. Secondly, constraints learning is regarded as an inductive logic programming problem, and we will focus on optimizing search strategy, search stop criterion and learning stop criterion. Lastly, the evaluation of grammar learning includes evaluation of grammar rules and constraints, we will study on redundant detection and ambiguity detection based on rule expansion set and evaluating constraints based on constraint classification and complexity. This research is an important foundation for further study of domain-independent system.

短文本理解是口语理解、语义搜索等应用的核心技术之一。短文本通常具有不符合书面语法、语境少歧义多等特点,本课题拟在已构建的一个基于领域本体和带约束语义文法的自然语言理解系统基础上,进一步研究和实现语义文法自动学习方法,包括:拟研究一种文法规则自动扩展学习方法,首先利用核心文法对解析失败句子进行部分解析,基于部分解析树预测顶层节点及子节点,基于相似性度量等进行规则扩展并构建完整解析树,经过垂直概化和平行概化处理后得到新文法规则;针对文法歧义问题,拟研究一种文法约束自动学习方法,将其看作一个ILP学习问题,通过改进搜索策略、约束搜索停止准则、约束学习停止准则等以保证高效地学习到可以覆盖尽量多正例且覆盖尽量少反例的约束;为了保证文法学习质量,拟研究基于文法规则扩展集的冗余检测和歧义检测方法以及基于约束划分效果和约束复杂度对文法约束进行评价。

项目摘要

针对短文本通常具有不符合书面语法、语境少歧义多等特点,本课题在已构建的一个基于领域本体和带约束语义文法的自然语言理解系统基础上,研究和实现了一种基于错误驱动的语义文法自动扩展学习方法,首先利用核心文法对解析失败句子进行部分解析,基于部分解析树预测顶层节点及子节点,基于相似性度量等进行规则扩展并构建完整解析树,经过垂直概化和平行概化处理后得到新文法规则;针对文法歧义问题,研究和实现了一种基于ILP的文法约束自动学习方法,通过改进搜索策略、约束搜索停止准则、约束学习停止准则等以保证高效地学习到可以覆盖尽量多正例且覆盖尽量少反例的约束;为了保证文法学习质量,研究和实现了基于文法规则扩展集的冗余检测和歧义检测方法以及基于约束划分效果和约束复杂度对文法约束进行评价。测试对比了提出的算法在不同规模领域的学习效率,以及更新后的文法和核心文法在两个领域数据集上的准确率和识别率等性能指标,实验结果表明,本项目所提出的文法扩展学习和约束学习方法是有效的。研究成果在诸多应用领域,如智能客服、智能信息检索、智能推荐系统等方面,均有着潜在的应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
3

Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究

Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究

DOI:
发表时间:2020
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019

王东升的其他基金

批准号:50578155
批准年份:2005
资助金额:27.00
项目类别:面上项目
批准号:29807004
批准年份:1998
资助金额:10.90
项目类别:青年科学基金项目
批准号:50078051
批准年份:2000
资助金额:19.00
项目类别:面上项目
批准号:51178071
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:51778604
批准年份:2017
资助金额:62.00
项目类别:面上项目
批准号:41702213
批准年份:2017
资助金额:23.00
项目类别:青年科学基金项目
批准号:51778206
批准年份:2017
资助金额:59.00
项目类别:面上项目
批准号:51478074
批准年份:2014
资助金额:86.00
项目类别:面上项目
批准号:51408161
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:50878033
批准年份:2008
资助金额:34.00
项目类别:面上项目
批准号:50308027
批准年份:2003
资助金额:27.00
项目类别:青年科学基金项目
批准号:51338010
批准年份:2013
资助金额:300.00
项目类别:重点项目
批准号:20477054
批准年份:2004
资助金额:24.00
项目类别:面上项目
批准号:31560024
批准年份:2015
资助金额:40.00
项目类别:地区科学基金项目

相似国自然基金

1

面向汉语文本理解的语义计算方法

批准号:91520204
批准年份:2015
负责人:赵铁军
学科分类:F03
资助金额:171.00
项目类别:重大研究计划
2

图像语义自动文本描述技术研究

批准号:61370157
批准年份:2013
负责人:周向东
学科分类:F0210
资助金额:76.00
项目类别:面上项目
3

语义深度理解驱动的图像及文本统一检索研究

批准号:61762025
批准年份:2017
负责人:强保华
学科分类:F0211
资助金额:37.00
项目类别:地区科学基金项目
4

基于弱监督和迁移学习的深度文本理解模型学习方法

批准号:61876144
批准年份:2018
负责人:管子玉
学科分类:F0606
资助金额:62.00
项目类别:面上项目