面向短文本理解的带约束语义文法自动学习方法研究

基本信息

批准号：61702234

项目类别：青年科学基金项目

资助金额：21.00

负责人：王东升

学科分类：

依托单位：江苏科技大学

批准年份：2017

结题年份：2020

起止时间：2018-01-01 - 2020-12-31

项目状态：已结题

项目参与者：王卫民,陈向坚,诸峰,张健,唐洋

关键词：

短文本理解语义解析文法学习文法评价约束学习

结项摘要

Short texts understanding is crucial to many applications, such as speech understanding, semantic search etc. Short texts have some unique characteristics such as not always observing the syntax of written texts, less context and more ambiguous, which make them difficult to handle. Upon an existing natural language understanding system based on domain ontology and constrained semantic grammar, this research is to further study and realize the method of automatic learning of constrained semantic grammar. Firstly, a semantic grammar rule extending algorithm will be studied to solve domain coverage problem, which first partially parses the (ungrammatical) sentences based on the core semantic grammar, and attempts to build a complete parse tree, including predicting the top-level node of the partial parsing tree, generating and abstracting to learn new grammar rules. Secondly, constraints learning is regarded as an inductive logic programming problem, and we will focus on optimizing search strategy, search stop criterion and learning stop criterion. Lastly, the evaluation of grammar learning includes evaluation of grammar rules and constraints, we will study on redundant detection and ambiguity detection based on rule expansion set and evaluating constraints based on constraint classification and complexity. This research is an important foundation for further study of domain-independent system.

短文本理解是口语理解、语义搜索等应用的核心技术之一。短文本通常具有不符合书面语法、语境少歧义多等特点，本课题拟在已构建的一个基于领域本体和带约束语义文法的自然语言理解系统基础上，进一步研究和实现语义文法自动学习方法，包括：拟研究一种文法规则自动扩展学习方法，首先利用核心文法对解析失败句子进行部分解析，基于部分解析树预测顶层节点及子节点，基于相似性度量等进行规则扩展并构建完整解析树，经过垂直概化和平行概化处理后得到新文法规则；针对文法歧义问题，拟研究一种文法约束自动学习方法，将其看作一个ILP学习问题，通过改进搜索策略、约束搜索停止准则、约束学习停止准则等以保证高效地学习到可以覆盖尽量多正例且覆盖尽量少反例的约束；为了保证文法学习质量，拟研究基于文法规则扩展集的冗余检测和歧义检测方法以及基于约束划分效果和约束复杂度对文法约束进行评价。

项目摘要

针对短文本通常具有不符合书面语法、语境少歧义多等特点，本课题在已构建的一个基于领域本体和带约束语义文法的自然语言理解系统基础上，研究和实现了一种基于错误驱动的语义文法自动扩展学习方法，首先利用核心文法对解析失败句子进行部分解析，基于部分解析树预测顶层节点及子节点，基于相似性度量等进行规则扩展并构建完整解析树，经过垂直概化和平行概化处理后得到新文法规则；针对文法歧义问题，研究和实现了一种基于ILP的文法约束自动学习方法，通过改进搜索策略、约束搜索停止准则、约束学习停止准则等以保证高效地学习到可以覆盖尽量多正例且覆盖尽量少反例的约束；为了保证文法学习质量，研究和实现了基于文法规则扩展集的冗余检测和歧义检测方法以及基于约束划分效果和约束复杂度对文法约束进行评价。测试对比了提出的算法在不同规模领域的学习效率，以及更新后的文法和核心文法在两个领域数据集上的准确率和识别率等性能指标，实验结果表明，本项目所提出的文法扩展学习和约束学习方法是有效的。研究成果在诸多应用领域，如智能客服、智能信息检索、智能推荐系统等方面，均有着潜在的应用价值。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：10.12005/orms.2019.0029

发表时间：2019

DOI：10.11759/hykx20170605001

发表时间：2018

DOI：10.16232/j.cnki.1001-4179.2020.01.006

发表时间：2020

DOI：10.16213/j.cnki.scjas.2020.10.037

发表时间：2020

王东升的其他基金

批准号：50578155

批准年份：2005

资助金额：27.00

项目类别：面上项目

批准号：29807004

批准年份：1998

资助金额：10.90

项目类别：青年科学基金项目

批准号：50078051

批准年份：2000

资助金额：19.00

项目类别：面上项目

批准号：51178071

批准年份：2011

资助金额：60.00

项目类别：面上项目

批准号：51778604

批准年份：2017

资助金额：62.00

项目类别：面上项目

批准号：41702213

批准年份：2017

资助金额：23.00

项目类别：青年科学基金项目

批准号：51778206

批准年份：2017

资助金额：59.00

项目类别：面上项目

批准号：51478074

批准年份：2014

资助金额：86.00

项目类别：面上项目

批准号：51408161

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：50878033

批准年份：2008

资助金额：34.00

项目类别：面上项目

批准号：50308027

批准年份：2003

资助金额：27.00

项目类别：青年科学基金项目

批准号：51338010

批准年份：2013

资助金额：300.00

项目类别：重点项目

批准号：20477054

批准年份：2004

资助金额：24.00

项目类别：面上项目

批准号：31560024

批准年份：2015

资助金额：40.00

项目类别：地区科学基金项目

相似国自然基金

面向汉语文本理解的语义计算方法

批准号：91520204

批准年份：2015

负责人：赵铁军

学科分类：F03

资助金额：171.00

项目类别：重大研究计划

图像语义自动文本描述技术研究

批准号：61370157

批准年份：2013

负责人：周向东

学科分类：F0210

资助金额：76.00

项目类别：面上项目

语义深度理解驱动的图像及文本统一检索研究

批准号：61762025

批准年份：2017

负责人：强保华

学科分类：F0211

资助金额：37.00

项目类别：地区科学基金项目

基于弱监督和迁移学习的深度文本理解模型学习方法

批准号：61876144

批准年份：2018

负责人：管子玉

学科分类：F0606

资助金额：62.00

项目类别：面上项目

面向短文本理解的带约束语义文法自动学习方法研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

现代优化理论与应用

基于直觉模糊二元语义交互式群决策的技术创新项目选择

土体约束对海底管道整体屈曲的影响机理研究

河流岸线开发适宜性及发展潜力研究

新建城市零散作物种植地重金属污染研究——以昆明呈贡新区为例

王东升的其他基金

微污染水源水体有机物优化混凝机理、工艺及操作规范

纳米形态AI13的制备、提纯及其混凝作用机理研究

絮体形成、分形结构与性能的影响机制及其优化工艺基础

小半径曲线梁桥地震倒塌模式与控制对策研究

动态混凝絮体调控与界面过程优化机制及大数据模型

南秦岭马道变质杂岩的构造属性及折返机制研究

设置BRB跨海斜拉桥新型减震约束体系及其地震反应性态研究

汶川地震动特性及临近断层高墩桥梁破坏机理深入研究

基于微分几何的任意曲面荷载重复作用下层状半空间黏弹体系的理论解与计算

双向地震动作用平扭耦合弹塑性反应谱模型及其在性能抗震中应用

弯剪相互作用下钢筋混凝土桥墩地震破坏机理及损伤模型研究

新型多功能混凝剂及其微污染有机物强化絮凝原理

无机高分子絮凝剂的颗粒粒度效应、形成与影响机制及其应用

扣囊复膜孢酵母菌MIG1基因的调控功能及其信号传导通路研究

相似国自然基金