语音识别中的稀疏性深度学习

基本信息
批准号:61371136
项目类别:面上项目
资助金额:74.00
负责人:王东
学科分类:
依托单位:清华大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:郑方,刘超,王军,别凡虎
关键词:
语音识别
结项摘要

The deep Bayesian network (DBN) approach has demonstrated significant performance improvement for speech recognition, and has been regarded as a new tehcnical revolution in speech research. Nevertheless, the present DBN approach heavily relies on large amounts of training data, and is susceptible to noise and channel variation. These difficulties can be largely attributed to the weak prior constraint caused by the full-connected network topology. This project proposes a sparse deep learning approach, which employes the sparse coding theory to learn more terse and represenative deep networks by imposing sparse constrains on features and/or the DBN structure. This will largely releax the large-data dependency, and improve robustness against noise and channel change. In addition, the deep strucutre will provide us an opportunity to study the sparsely learned hierarchical patterns in a systematical way.

基于深度学习(Deep Learning)的深层贝叶斯网络技术(Deep Bayesian Network, DBN)为语音识别带来极为显著的性能提高,被认为是语音领域的又一次革命。然而,当前的DBN方法只有在大数据集上才能发挥其效能,并容易受到噪声和信道变化的干扰。DBN的这些困难很大程度上可以归因于其全结点连接结构带来的弱先验约束。本项目提出稀疏性深度学习方法,利用稀疏编码(Sparse Coding)理论,通过在DBN的特征或结构中加入稀疏性约束,使学习得到的网络更简洁,更具有对语音信号模式的代表性,因而降低对大规模训练数据的依赖,并增加对噪声和信道变化的鲁棒性。同时,DBN的深层结构可以使我们得以系统研究稀疏性层次化语音模式。

项目摘要

归功于深度学习(Deep Learning)对原始信号的分层学习能力,深度神经网络(DNN)在语音识别领域获得巨大成功。然而,DNN网络包含极大息信冗余,不仅浪费计算资源,也容易产生过拟合现象,降低了可扩展性。为提高DNN模型在语音识别任务中的可扩展性,本课题进行了深入研究,在三个方面取得了一系列进展。(一)研究了将稀疏编码与深度学习相结合的方法,发现最有效的稀疏约束方法是对网络连接进行剪裁。实验发现即全名去掉90%的连接权重也不会显著降低语音识别模型的性能;(二)研究了各种特征鲁棒性和模型鲁棒性方法,包括基于加噪自编码器(DAE)的前端特征去噪方法、基于随机采样的模型加噪训练方法、迁移学习方法等。这些方法极大提高了模型的可扩展性,对构造资源稀缺语言(如少数民族语言)的识别系统具有特别重要的意义;(三)认识到DNN的可扩展性本质上来源于语音信息中多种因子的互相混杂。课题组提出了多任务协同建模方法来解决这一问题,将单任务中的噪声因子转化为协同学习中的信息因子,从而极大解决了DNN 模型的可扩展性问题。受此启发,我们进步一提出了语音信号深度分解方法,基于DNN将语号信号分解成任务相关的信息因子。这一深度分解方法为语音信号信息处理提供了新思路。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

DOI:10.6041/j.issn.1000-1298.2022.07.022
发表时间:2022
2

基于小波高阶统计量的数字图像来源取证方法

基于小波高阶统计量的数字图像来源取证方法

DOI:
发表时间:2017
3

基于注意力机制和多尺度残差网络的农作物病害识别

基于注意力机制和多尺度残差网络的农作物病害识别

DOI:710.6041/j.issn.1000-1298.2021.10.027
发表时间:2021
4

基于转置卷积神经网络的路面裂缝识别算法

基于转置卷积神经网络的路面裂缝识别算法

DOI:10.12141/j.issn.1000-565x.210178
发表时间:2021
5

基于数据手套和神经网络的数字手势识别方法

基于数据手套和神经网络的数字手势识别方法

DOI:10.3969/j.issn.1001-0505.2020.03.020
发表时间:2020

王东的其他基金

批准号:30960290
批准年份:2009
资助金额:23.00
项目类别:地区科学基金项目
批准号:51605364
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:61272061
批准年份:2012
资助金额:82.00
项目类别:面上项目
批准号:30340044
批准年份:2003
资助金额:10.00
项目类别:专项基金项目
批准号:81671380
批准年份:2016
资助金额:60.00
项目类别:面上项目
批准号:30872975
批准年份:2008
资助金额:31.00
项目类别:面上项目
批准号:61574013
批准年份:2015
资助金额:62.00
项目类别:面上项目
批准号:30670147
批准年份:2006
资助金额:22.00
项目类别:面上项目
批准号:61205115
批准年份:2012
资助金额:29.00
项目类别:青年科学基金项目
批准号:61805167
批准年份:2018
资助金额:24.00
项目类别:青年科学基金项目
批准号:20332030
批准年份:2003
资助金额:120.00
项目类别:重点项目
批准号:21801169
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目
批准号:30070061
批准年份:2000
资助金额:15.00
项目类别:面上项目
批准号:51201163
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:30670628
批准年份:2006
资助金额:29.00
项目类别:面上项目
批准号:81803626
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:81372041
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:61802011
批准年份:2018
资助金额:25.00
项目类别:青年科学基金项目
批准号:61106022
批准年份:2011
资助金额:30.00
项目类别:青年科学基金项目
批准号:61871401
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:51104084
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:29472067
批准年份:1994
资助金额:7.00
项目类别:面上项目
批准号:51204095
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:81100920
批准年份:2011
资助金额:22.00
项目类别:青年科学基金项目
批准号:29274189
批准年份:1992
资助金额:5.00
项目类别:面上项目
批准号:81370589
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:81473673
批准年份:2014
资助金额:66.00
项目类别:面上项目
批准号:11347184
批准年份:2013
资助金额:5.00
项目类别:专项基金项目
批准号:61675006
批准年份:2016
资助金额:60.00
项目类别:面上项目
批准号:71801059
批准年份:2018
资助金额:18.00
项目类别:青年科学基金项目
批准号:51272268
批准年份:2012
资助金额:80.00
项目类别:面上项目
批准号:11075199
批准年份:2010
资助金额:34.00
项目类别:面上项目
批准号:30170172
批准年份:2001
资助金额:7.00
项目类别:面上项目
批准号:61104114
批准年份:2011
资助金额:23.00
项目类别:青年科学基金项目
批准号:31701326
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:31170310
批准年份:2011
资助金额:68.00
项目类别:面上项目
批准号:29872041
批准年份:1998
资助金额:20.00
项目类别:面上项目
批准号:81573034
批准年份:2015
资助金额:55.00
项目类别:面上项目
批准号:28770100
批准年份:1987
资助金额:3.00
项目类别:面上项目
批准号:30870151
批准年份:2008
资助金额:32.00
项目类别:面上项目
批准号:29070063
批准年份:1990
资助金额:2.50
项目类别:面上项目
批准号:31401077
批准年份:2014
资助金额:24.00
项目类别:青年科学基金项目
批准号:50877077
批准年份:2008
资助金额:38.00
项目类别:面上项目
批准号:30800673
批准年份:2008
资助金额:20.00
项目类别:青年科学基金项目
批准号:31270378
批准年份:2012
资助金额:88.00
项目类别:面上项目
批准号:31271660
批准年份:2012
资助金额:70.00
项目类别:面上项目
批准号:31760751
批准年份:2017
资助金额:37.00
项目类别:地区科学基金项目
批准号:51771193
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:51874160
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:21371016
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:30472004
批准年份:2004
资助金额:20.00
项目类别:面上项目
批准号:11505074
批准年份:2015
资助金额:22.00
项目类别:青年科学基金项目
批准号:51905336
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:51673016
批准年份:2016
资助金额:61.00
项目类别:面上项目
批准号:81772495
批准年份:2017
资助金额:57.00
项目类别:面上项目
批准号:31901193
批准年份:2019
资助金额:23.00
项目类别:青年科学基金项目
批准号:81171904
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:61473055
批准年份:2014
资助金额:80.00
项目类别:面上项目
批准号:U1932143
批准年份:2019
资助金额:59.00
项目类别:联合基金项目
批准号:51604255
批准年份:2016
资助金额:21.00
项目类别:青年科学基金项目
批准号:11875146
批准年份:2018
资助金额:62.00
项目类别:面上项目
批准号:51137005
批准年份:2011
资助金额:310.00
项目类别:重点项目
批准号:81070386
批准年份:2010
资助金额:10.00
项目类别:面上项目
批准号:30270098
批准年份:2002
资助金额:25.00
项目类别:面上项目
批准号:29674037
批准年份:1996
资助金额:9.00
项目类别:面上项目
批准号:81173477
批准年份:2011
资助金额:60.00
项目类别:面上项目

相似国自然基金

1

异质噪声场景语音识别中的结构化深度学习研究

批准号:61603252
批准年份:2016
负责人:钱彦旻
学科分类:F0605
资助金额:22.00
项目类别:青年科学基金项目
2

基于稀疏表示和字典学习的深度图像序列人体行为识别

批准号:U1504611
批准年份:2015
负责人:宋相法
学科分类:F0605
资助金额:27.00
项目类别:联合基金项目
3

知识引导的深度学习语音降噪研究

批准号:61876214
批准年份:2018
负责人:张学良
学科分类:F0605
资助金额:62.00
项目类别:面上项目
4

基于端到端深度学习框架的文本无关副语言语音属性识别研究

批准号:61773413
批准年份:2017
负责人:李明
学科分类:F0605
资助金额:60.00
项目类别:面上项目