面向中文口语理解的非参数贝叶斯分析方法的研究和应用

基本信息
批准号:61562068
项目类别:地区科学基金项目
资助金额:36.00
负责人:李艳玲
学科分类:
依托单位:内蒙古师范大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:林民,殷雁君,张志平,张树钧,于海清,郭改枝,戚桂美,田长波,张巧燕
关键词:
口语自动问答对话
结项摘要

The project proposes using non-parametric Bayesian analysis for Chinese spoken language understanding (SLU) to reduce the human effort during annotated process. Non-parametric Bayesian analysis is a hotspot in machine learning area and applied effectively in signal processing area etc. As we have known, there are no reports about the applications in Chinese SLU. Based on the leading edge of the track, we applied this approach in three subtasks of SLU, which are recognition of dialog acts, intents and named entities. The project will be carried out in-depth research on theory and approach. The main research content contains these three components. First, we study some kinds of non-parametric Bayesian model based on Dirichlet Process(DP) as prior distribution and corresponding parameter estimation methods.Second, modeling methods based on Dirichlet Process(DP) as prior distribution applied in three subtasks of Chinese SLU are analyzed. Third, combined with dialogue spoken corpora of city traveling and bus route query, performance evaluation is studied about unsupervised method to solve each task of SLU as well as the overall framework. By conducting the project, it will provide a new unsupervised theoretical guidance for understanding of Chinese spoken language, reduces application and development costs about spoken dialog system, but also provide reference for information mining texts.

本项目提出使用非参数贝叶斯分析对中文口语理解框架进行研究,以达到减少口语理解过程中大量人工标注的目的。非参数贝叶斯分析是机器学习领域的前沿课题,该方法已经被有效地应用于信号处理的很多领域,目前还未见到在中文口语理解方面的应用。本项目拟对中文口语理解中的对话行为、意图识别和命名实体识别三个任务开展深入研究,主要包括:1、研究以Dirichlet过程作为先验分布的各种非参数贝叶斯模型以及参数估计方法;2、使用以Dirichlet过程为先验分布的非参数贝叶斯方法对中文口语理解的三个子任务的建模方法研究;3、结合城市旅游公交领域的对话语料对无监督方法解决中文口语理解各个子任务以及整体框架进行性能评价研究。通过本项目的研究,不仅可以为中文口语理解提供全新的无监督的理论依据和方法指导,减少口语对话系统的开发成本,还为文本的信息挖掘提供参考和借鉴。

项目摘要

本研究以人机对话系统为中心,重点研究其中的口语理解任务,以及为对话服务的知识库自动构建、对话管理。深入研究每个部分相关算法的改进方法,具体研究内容包括:. (1)研究口语理解的两个子任务——意图识别和语义槽填充,重点研究联合建模,提出了使用三角链条件随机场模型对中文口语理解两个子任务联合建模。将两个任务集成到一个模型中,共享参数,通过一次训练解决两个任务。该内容进一步深入研究,提出基于注意力机制的双向长短时记忆模型对呼和浩特市公交问路查询语句进行两个子任务的联合识别,并探索了基于字和基于词标注的不同效果。在此基础上继续改进,提出融合注意力机制、语义槽门控机制、条件随机场的双向长短时记忆模型,进一步考虑了标签前后的依赖关系,对意图识别的结果利用门控进行约束再用于语义槽识别,有效的提高了两个任务的性能。. 针对当前对话系统中存在多领域意图的情况,研究基于胶囊网络的多意图识别方法,提出通过在胶囊网络中增加卷积胶囊层提取意图文本的深层次语义信息,同时利用胶囊网络中的动态路由将特征胶囊动态分配到意图胶囊类别中,通过设置阈值大小判别多种意图存在的概率,进行多意图识别。. (2)人机对话系统背后需要强大的知识库做支撑,为了进一步提高机器回答问题的正确率,研究了几种信息抽取方法,提出了混合方法的历史沿革信息抽取算法,融合PAM和主题偏好TextRank的历史沿革信息抽取算法,基于维基百科的领域概念知识库的自动构建方法以及基于双模型投票的人物关系抽取方法。. (3)针对特定领域的多轮对话数据难以收集的问题,提出一种结合规划的离散深度确定性策略梯度算法,并通过预订电影票的对话任务验证了该方法的有效性和可行性。. 以上成果共发表论文14篇,其中9篇专业核心期刊论文,5篇国际会议论文,申请软件著作权4项,出版专著1部,培养研究生7人,一人入选内蒙古自治区“草原英才”工程青年创新创业人才第一层次人选。完成了预期的研究任务和目标。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

采用深度学习的铣刀磨损状态预测模型

采用深度学习的铣刀磨损状态预测模型

DOI:10.3969/j.issn.1004-132x.2020.17.009
发表时间:2020
2

热塑性复合材料机器人铺放系统设计及工艺优化研究

热塑性复合材料机器人铺放系统设计及工艺优化研究

DOI:10.3901/jme.2021.23.209
发表时间:2021
3

步行设施内疏散行人拥挤踩踏仿真研究

步行设施内疏散行人拥挤踩踏仿真研究

DOI:10.16097/j.cnki.1009-6744.2020.03.029
发表时间:2020
4

采用虚线交通标线进行车辆定位及道路交通设施信息表征的方法

采用虚线交通标线进行车辆定位及道路交通设施信息表征的方法

DOI:10.13607/j.cnki.gljt.2022.05.019
发表时间:2022
5

考虑故障处理过程信息系统连通性和准确性的配电网可靠性评估

考虑故障处理过程信息系统连通性和准确性的配电网可靠性评估

DOI:10.13335/j.1000-3673.pst.2018.1478
发表时间:2020

李艳玲的其他基金

批准号:41877296
批准年份:2018
资助金额:61.00
项目类别:面上项目
批准号:61765007
批准年份:2017
资助金额:37.00
项目类别:地区科学基金项目
批准号:81403036
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:11365011
批准年份:2013
资助金额:48.00
项目类别:地区科学基金项目
批准号:40602039
批准年份:2006
资助金额:27.00
项目类别:青年科学基金项目
批准号:40972114
批准年份:2009
资助金额:50.00
项目类别:面上项目
批准号:31302000
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:11247207
批准年份:2012
资助金额:5.00
项目类别:专项基金项目
批准号:41372184
批准年份:2013
资助金额:87.00
项目类别:面上项目
批准号:61806103
批准年份:2018
资助金额:24.00
项目类别:青年科学基金项目
批准号:41172152
批准年份:2011
资助金额:82.00
项目类别:面上项目
批准号:61672021
批准年份:2016
资助金额:50.00
项目类别:面上项目
批准号:41672173
批准年份:2016
资助金额:68.00
项目类别:面上项目
批准号:81201062
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

面向目标跟踪的混合系统非参数贝叶斯推演

批准号:61771399
批准年份:2017
负责人:徐林峰
学科分类:F0112
资助金额:61.00
项目类别:面上项目
2

非可交换的非参数贝叶斯方法的统计推断及应用

批准号:11901488
批准年份:2019
负责人:朱蔚萱
学科分类:A0403
资助金额:23.00
项目类别:青年科学基金项目
3

变换结构方程模型的非参数贝叶斯分析

批准号:11471277
批准年份:2014
负责人:宋心远
学科分类:A0403
资助金额:60.00
项目类别:面上项目
4

深度迁移学习在中文口语理解中的研究和应用

批准号:61806103
批准年份:2018
负责人:李艳玲
学科分类:F0606
资助金额:24.00
项目类别:青年科学基金项目