深度迁移学习在中文口语理解中的研究和应用

基本信息
批准号:61806103
项目类别:青年科学基金项目
资助金额:24.00
负责人:李艳玲
学科分类:
依托单位:内蒙古师范大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:林民,张树钧,苗忠义,朱丽波,于海清,尹志凌,侯宏霞,刘娇,赵崟江
关键词:
意图识别深度神经网络命名实体识别迁移学习口语理解
结项摘要

The project proposes using deep transfer learning for Chinese spoken language understanding (SLU)from source domain to target domain to reduce development cost. Transfer learning is a hotspot in human intelligence and still in an exploratory state. As we have known, there are no reports about the applications in Chinese SLU. We applied this approach in two subtasks of SLU, which are recognition of intents and named entities. The project will be carried out in-depth research on theory and approach. The main research content contains these three components. First, on the basis of summarizing previous studies, we further study the modeling methods of two sub tasks by deep neural network for spoken language understanding. We hope to study and evaluate the experiment results, construction methods and efficiency of experiments. Second, we study the modeling method of transfer learning applied in deep neural networks and analyze, summarize the methods and theoretical support of transfer learning in cross-domain transferring. Third, combined with the field of tourism traffic of the project dialogue corpus, as well as target data of booking train tickets, airlines and hotels, we do experiments for overall framework of deep learning and transfer learning framework and hope to analyze theoretically and give out guiding conclusions.

本项目提出使用深度迁移学习对中文口语理解任务进行研究,从已有的开发领域向目标领域迁移,以达到减少开发成本的目的。迁移学习是人工智能领域的前沿课题,但仍处于探索阶段,而且未见在中文口语理解方面的应用。本项目拟对中文口语理解的意图识别和命名实体识别两个子任务进行深入研究,主要包括:第一,在总结前人研究的基础上,进一步研究深度神经网络对口语理解两个子任务的建模方法,希望对各种深度神经网络模型的实验效果、构建方法、实验效率进行研究并给出评价;第二,研究迁移学习应用在上述深度神经网络上的建模方法,分析、归纳和总结迁移学习在跨领域迁移时所需要的条件、方法和背后的理论支持;第三,结合本项目的旅游交通领域的对话语料,以及预订火车票、飞机票、宾馆的领域数据,对口语理解的子任务以及整体深度学习框架和迁移学习框架进行实验、理论分析并给出具有指导意义的结论。

项目摘要

本项目以人机对话为中心,重点研究语言理解的两个子任务——意图识别和语义槽填充的建模方法,以及开发新领域对话系统时数据稀缺的迁移学习方法,具体研究包括: . (1)提出了BERT+CRF的意图和语义槽联合识别模型, 利用BERT的多头注意机制充分学习上下文特征,捕捉长距离依赖关系,通过实验获得当前几类联合模型中的最佳性能。. (2)提出了改进的胶囊网络进行多意图识别,在胶囊网络中加入了卷积胶囊层以获取意图的深层语义特征,进一步提高了多意图的识别率。. (3)提出一种结合规划的离散深度确定性策略梯度DDPG算法优化对话策略。在整个训练过程中,代理使用此算法改进对话策略,最后通过预订电影票的对话任务验证该方法的有效性和可行性。. (4)针对新领域对话系统中意图识别数据稀缺的问题,提出一种结合胶囊网络的领域适应方法,通过对源域和目标域特征进行二次提取,充分提取意图文本的深层次特征信息,捕捉不同领域的独有特征,提高领域的判别能力,提升领域适应的可靠性,并且提升意图识别器对目标域的意图识别能力。. (5)针对模型迁移存在负迁移的问题,提出使用对抗迁移学习进行命名实体识别的方法,在共享特征提取器上添加一个对抗鉴别器,使用完全共享和共享-私有这两种共享模式,普通对抗鉴别器有效解决了负迁移的问题,而广义资源对抗鉴别器在其基础上更进一步,成功解决了源域和目标域之间数据量不平衡的问题。. 以上研究共发表中文核心期刊论文9篇,申请软件著作权8项,培养研究生毕业7人,项目主持人入选内蒙古自治区“草原英才”工程青年创新创业人才第一层次人选和内蒙古自治区“新世纪321人才工程”第二层次人选,1名研究生的硕士论文获得校级优秀硕士学位论文,多名研究生获省级奖励,研究生培养成效显著,完成了预期的研究任务和目标。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
3

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理

DOI:10.19783/j.cnki.pspc.200521
发表时间:2021

李艳玲的其他基金

批准号:41877296
批准年份:2018
资助金额:61.00
项目类别:面上项目
批准号:61765007
批准年份:2017
资助金额:37.00
项目类别:地区科学基金项目
批准号:81403036
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:11365011
批准年份:2013
资助金额:48.00
项目类别:地区科学基金项目
批准号:40602039
批准年份:2006
资助金额:27.00
项目类别:青年科学基金项目
批准号:40972114
批准年份:2009
资助金额:50.00
项目类别:面上项目
批准号:31302000
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:11247207
批准年份:2012
资助金额:5.00
项目类别:专项基金项目
批准号:41372184
批准年份:2013
资助金额:87.00
项目类别:面上项目
批准号:41172152
批准年份:2011
资助金额:82.00
项目类别:面上项目
批准号:61672021
批准年份:2016
资助金额:50.00
项目类别:面上项目
批准号:41672173
批准年份:2016
资助金额:68.00
项目类别:面上项目
批准号:61562068
批准年份:2015
资助金额:36.00
项目类别:地区科学基金项目
批准号:81201062
批准年份:2012
资助金额:23.00
项目类别:青年科学基金项目

相似国自然基金

1

基于深度学习的鲁棒口语理解研究

批准号:61573241
批准年份:2015
负责人:俞凯
学科分类:F0605
资助金额:64.00
项目类别:面上项目
2

面向中文口语理解的非参数贝叶斯分析方法的研究和应用

批准号:61562068
批准年份:2015
负责人:李艳玲
学科分类:F0211
资助金额:36.00
项目类别:地区科学基金项目
3

基于弱监督和迁移学习的深度文本理解模型学习方法

批准号:61876144
批准年份:2018
负责人:管子玉
学科分类:F0606
资助金额:62.00
项目类别:面上项目
4

中文自动口语摘要技术研究

批准号:61170197
批准年份:2011
负责人:吴及
学科分类:F0211
资助金额:55.00
项目类别:面上项目