深度迁移学习在中文口语理解中的研究和应用

基本信息

批准号：61806103

项目类别：青年科学基金项目

资助金额：24.00

负责人：李艳玲

学科分类：

依托单位：内蒙古师范大学

批准年份：2018

结题年份：2021

起止时间：2019-01-01 - 2021-12-31

项目状态：已结题

项目参与者：林民,张树钧,苗忠义,朱丽波,于海清,尹志凌,侯宏霞,刘娇,赵崟江

关键词：

意图识别深度神经网络命名实体识别迁移学习口语理解

结项摘要

The project proposes using deep transfer learning for Chinese spoken language understanding (SLU)from source domain to target domain to reduce development cost. Transfer learning is a hotspot in human intelligence and still in an exploratory state. As we have known, there are no reports about the applications in Chinese SLU. We applied this approach in two subtasks of SLU, which are recognition of intents and named entities. The project will be carried out in-depth research on theory and approach. The main research content contains these three components. First, on the basis of summarizing previous studies, we further study the modeling methods of two sub tasks by deep neural network for spoken language understanding. We hope to study and evaluate the experiment results, construction methods and efficiency of experiments. Second, we study the modeling method of transfer learning applied in deep neural networks and analyze, summarize the methods and theoretical support of transfer learning in cross-domain transferring. Third, combined with the field of tourism traffic of the project dialogue corpus, as well as target data of booking train tickets, airlines and hotels, we do experiments for overall framework of deep learning and transfer learning framework and hope to analyze theoretically and give out guiding conclusions.

本项目提出使用深度迁移学习对中文口语理解任务进行研究，从已有的开发领域向目标领域迁移，以达到减少开发成本的目的。迁移学习是人工智能领域的前沿课题，但仍处于探索阶段，而且未见在中文口语理解方面的应用。本项目拟对中文口语理解的意图识别和命名实体识别两个子任务进行深入研究，主要包括：第一，在总结前人研究的基础上，进一步研究深度神经网络对口语理解两个子任务的建模方法，希望对各种深度神经网络模型的实验效果、构建方法、实验效率进行研究并给出评价；第二，研究迁移学习应用在上述深度神经网络上的建模方法，分析、归纳和总结迁移学习在跨领域迁移时所需要的条件、方法和背后的理论支持；第三，结合本项目的旅游交通领域的对话语料，以及预订火车票、飞机票、宾馆的领域数据，对口语理解的子任务以及整体深度学习框架和迁移学习框架进行实验、理论分析并给出具有指导意义的结论。

项目摘要

本项目以人机对话为中心，重点研究语言理解的两个子任务——意图识别和语义槽填充的建模方法，以及开发新领域对话系统时数据稀缺的迁移学习方法，具体研究包括： . (1)提出了BERT+CRF的意图和语义槽联合识别模型, 利用BERT的多头注意机制充分学习上下文特征，捕捉长距离依赖关系，通过实验获得当前几类联合模型中的最佳性能。. (2)提出了改进的胶囊网络进行多意图识别，在胶囊网络中加入了卷积胶囊层以获取意图的深层语义特征，进一步提高了多意图的识别率。. (3)提出一种结合规划的离散深度确定性策略梯度DDPG算法优化对话策略。在整个训练过程中，代理使用此算法改进对话策略，最后通过预订电影票的对话任务验证该方法的有效性和可行性。. (4)针对新领域对话系统中意图识别数据稀缺的问题，提出一种结合胶囊网络的领域适应方法，通过对源域和目标域特征进行二次提取，充分提取意图文本的深层次特征信息，捕捉不同领域的独有特征，提高领域的判别能力，提升领域适应的可靠性，并且提升意图识别器对目标域的意图识别能力。. (5)针对模型迁移存在负迁移的问题，提出使用对抗迁移学习进行命名实体识别的方法，在共享特征提取器上添加一个对抗鉴别器，使用完全共享和共享-私有这两种共享模式，普通对抗鉴别器有效解决了负迁移的问题，而广义资源对抗鉴别器在其基础上更进一步，成功解决了源域和目标域之间数据量不平衡的问题。. 以上研究共发表中文核心期刊论文9篇，申请软件著作权8项，培养研究生毕业7人，项目主持人入选内蒙古自治区“草原英才”工程青年创新创业人才第一层次人选和内蒙古自治区“新世纪321人才工程”第二层次人选，1名研究生的硕士论文获得校级优秀硕士学位论文，多名研究生获省级奖励，研究生培养成效显著，完成了预期的研究任务和目标。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：

发表时间：2021

DOI：10.3969/j.issn.1001-1978.2022.02.019

发表时间：2022

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：10.3969/j.issn.1674-0696.2020.10.20

发表时间：2020

李艳玲的其他基金

批准号：41877296

批准年份：2018

资助金额：61.00

项目类别：面上项目

批准号：61765007

批准年份：2017

资助金额：37.00

项目类别：地区科学基金项目

批准号：81403036

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：11365011

批准年份：2013

资助金额：48.00

项目类别：地区科学基金项目

批准号：40602039

批准年份：2006

资助金额：27.00

项目类别：青年科学基金项目

批准号：40972114

批准年份：2009

资助金额：50.00

项目类别：面上项目

批准号：31302000

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：11247207

批准年份：2012

资助金额：5.00

项目类别：专项基金项目

批准号：41372184

批准年份：2013

资助金额：87.00

项目类别：面上项目

批准号：41172152

批准年份：2011

资助金额：82.00

项目类别：面上项目

批准号：61672021

批准年份：2016

资助金额：50.00

项目类别：面上项目

批准号：41672173

批准年份：2016

资助金额：68.00

项目类别：面上项目

批准号：61562068

批准年份：2015

资助金额：36.00

项目类别：地区科学基金项目

批准号：81201062

批准年份：2012

资助金额：23.00

项目类别：青年科学基金项目

相似国自然基金

基于深度学习的鲁棒口语理解研究

批准号：61573241

批准年份：2015

负责人：俞凯

学科分类：F0605

资助金额：64.00

项目类别：面上项目

面向中文口语理解的非参数贝叶斯分析方法的研究和应用

批准号：61562068

批准年份：2015

负责人：李艳玲

学科分类：F0211

资助金额：36.00

项目类别：地区科学基金项目

基于弱监督和迁移学习的深度文本理解模型学习方法

批准号：61876144

批准年份：2018

负责人：管子玉

学科分类：F0606

资助金额：62.00

项目类别：面上项目

中文自动口语摘要技术研究

批准号：61170197

批准年份：2011

负责人：吴及

学科分类：F0211

资助金额：55.00

项目类别：面上项目

深度迁移学习在中文口语理解中的研究和应用

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于改进LinkNet的寒旱区遥感图像河流识别方法

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

TRPV1/SIRT1介导吴茱萸次碱抗Ang Ⅱ诱导的血管平滑肌细胞衰老

现代优化理论与应用

含饱和非线性的主动悬架系统自适应控制

李艳玲的其他基金

西南地区不同类型高山湖泊生态系统对酸沉降/氮沉降和气候变暖的响应特征与规律

非马尔科夫噪声下的量子参数估计研究

内生镰刀菌BDF09促进白花丹参毛状根中酚酸类成分积累的机制研究

基于腔与光纤耦合系统的分布式量子计算研究

抚仙湖硅藻埋藏学的研究及其在古环境重建中的意义

西南季风区2.8Ma以来高分辨率硅藻记录与古气候重建

植物精油抑制瘤胃产甲烷的效果及其微生物学机理

非马尔科夫耗散条件下制备多体量子纠缠态的研究

云南地区不同类型湖泊生态系统多尺度转换过程与驱动机制研究

硅藻定量重建古温度新方法的研究及其在云南湖泊构建不同时间尺度序列中的应用

多密度反应扩散模型的计算机辅助分析研究与应用

云南地区不同类型湖泊全新世以来温暖和寒冷季节温度的定量重建

面向中文口语理解的非参数贝叶斯分析方法的研究和应用

孤独症相关异常神经微环路的早期发育机制研究

相似国自然基金