语音识别中的稀疏性深度学习

基本信息

批准号：61371136

项目类别：面上项目

资助金额：74.00

负责人：王东

学科分类：

依托单位：清华大学

批准年份：2013

结题年份：2017

起止时间：2014-01-01 - 2017-12-31

项目状态：已结题

项目参与者：郑方,刘超,王军,别凡虎

关键词：

语音识别

结项摘要

The deep Bayesian network (DBN) approach has demonstrated significant performance improvement for speech recognition, and has been regarded as a new tehcnical revolution in speech research. Nevertheless, the present DBN approach heavily relies on large amounts of training data, and is susceptible to noise and channel variation. These difficulties can be largely attributed to the weak prior constraint caused by the full-connected network topology. This project proposes a sparse deep learning approach, which employes the sparse coding theory to learn more terse and represenative deep networks by imposing sparse constrains on features and/or the DBN structure. This will largely releax the large-data dependency, and improve robustness against noise and channel change. In addition, the deep strucutre will provide us an opportunity to study the sparsely learned hierarchical patterns in a systematical way.

基于深度学习(Deep Learning)的深层贝叶斯网络技术(Deep Bayesian Network, DBN)为语音识别带来极为显著的性能提高，被认为是语音领域的又一次革命。然而，当前的DBN方法只有在大数据集上才能发挥其效能，并容易受到噪声和信道变化的干扰。DBN的这些困难很大程度上可以归因于其全结点连接结构带来的弱先验约束。本项目提出稀疏性深度学习方法，利用稀疏编码（Sparse Coding)理论，通过在DBN的特征或结构中加入稀疏性约束，使学习得到的网络更简洁，更具有对语音信号模式的代表性，因而降低对大规模训练数据的依赖，并增加对噪声和信道变化的鲁棒性。同时，DBN的深层结构可以使我们得以系统研究稀疏性层次化语音模式。

项目摘要

归功于深度学习（Deep Learning）对原始信号的分层学习能力，深度神经网络（DNN）在语音识别领域获得巨大成功。然而，DNN网络包含极大息信冗余，不仅浪费计算资源，也容易产生过拟合现象，降低了可扩展性。为提高DNN模型在语音识别任务中的可扩展性，本课题进行了深入研究，在三个方面取得了一系列进展。（一）研究了将稀疏编码与深度学习相结合的方法，发现最有效的稀疏约束方法是对网络连接进行剪裁。实验发现即全名去掉90%的连接权重也不会显著降低语音识别模型的性能；（二）研究了各种特征鲁棒性和模型鲁棒性方法，包括基于加噪自编码器（DAE）的前端特征去噪方法、基于随机采样的模型加噪训练方法、迁移学习方法等。这些方法极大提高了模型的可扩展性，对构造资源稀缺语言（如少数民族语言）的识别系统具有特别重要的意义；（三）认识到DNN的可扩展性本质上来源于语音信息中多种因子的互相混杂。课题组提出了多任务协同建模方法来解决这一问题，将单任务中的噪声因子转化为协同学习中的信息因子，从而极大解决了DNN 模型的可扩展性问题。受此启发，我们进步一提出了语音信号深度分解方法，基于DNN将语号信号分解成任务相关的信息因子。这一深度分解方法为语音信号信息处理提供了新思路。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：

发表时间：2017

DOI：710.6041/j.issn.1000-1298.2021.10.027

发表时间：2021

DOI：10.12141/j.issn.1000-565x.210178

发表时间：2021

DOI：10.3969/j.issn.1001-0505.2020.03.020

发表时间：2020

王东的其他基金

批准号：30960290

批准年份：2009

资助金额：23.00

项目类别：地区科学基金项目

批准号：51605364

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：61272061

批准年份：2012

资助金额：82.00

项目类别：面上项目

批准号：30340044

批准年份：2003

资助金额：10.00

项目类别：专项基金项目

批准号：81671380

批准年份：2016

资助金额：60.00

项目类别：面上项目

批准号：30872975

批准年份：2008

资助金额：31.00

项目类别：面上项目

批准号：61574013

批准年份：2015

资助金额：62.00

项目类别：面上项目

批准号：30670147

批准年份：2006

资助金额：22.00

项目类别：面上项目

批准号：61205115

批准年份：2012

资助金额：29.00

项目类别：青年科学基金项目

批准号：61805167

批准年份：2018

资助金额：24.00

项目类别：青年科学基金项目

批准号：20332030

批准年份：2003

资助金额：120.00

项目类别：重点项目

批准号：21801169

批准年份：2018

资助金额：26.00

项目类别：青年科学基金项目

批准号：30070061

批准年份：2000

资助金额：15.00

项目类别：面上项目

批准号：51201163

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：30670628

批准年份：2006

资助金额：29.00

项目类别：面上项目

批准号：81803626

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：81372041

批准年份：2013

资助金额：70.00

项目类别：面上项目

批准号：61802011

批准年份：2018

资助金额：25.00

项目类别：青年科学基金项目

批准号：61106022

批准年份：2011

资助金额：30.00

项目类别：青年科学基金项目

批准号：61871401

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：51104084

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：29472067

批准年份：1994

资助金额：7.00

项目类别：面上项目

批准号：51204095

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：81100920

批准年份：2011

资助金额：22.00

项目类别：青年科学基金项目

批准号：29274189

批准年份：1992

资助金额：5.00

项目类别：面上项目

批准号：81370589

批准年份：2013

资助金额：70.00

项目类别：面上项目

批准号：81473673

批准年份：2014

资助金额：66.00

项目类别：面上项目

批准号：11347184

批准年份：2013

资助金额：5.00

项目类别：专项基金项目

批准号：61675006

批准年份：2016

资助金额：60.00

项目类别：面上项目

批准号：71801059

批准年份：2018

资助金额：18.00

项目类别：青年科学基金项目

批准号：51272268

批准年份：2012

资助金额：80.00

项目类别：面上项目

批准号：11075199

批准年份：2010

资助金额：34.00

项目类别：面上项目

批准号：30170172

批准年份：2001

资助金额：7.00

项目类别：面上项目

批准号：61104114

批准年份：2011

资助金额：23.00

项目类别：青年科学基金项目

批准号：31701326

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：31170310

批准年份：2011

资助金额：68.00

项目类别：面上项目

批准号：29872041

批准年份：1998

资助金额：20.00

项目类别：面上项目

批准号：81573034

批准年份：2015

资助金额：55.00

项目类别：面上项目

批准号：28770100

批准年份：1987

资助金额：3.00

项目类别：面上项目

批准号：30870151

批准年份：2008

资助金额：32.00

项目类别：面上项目

批准号：29070063

批准年份：1990

资助金额：2.50

项目类别：面上项目

批准号：31401077

批准年份：2014

资助金额：24.00

项目类别：青年科学基金项目

批准号：50877077

批准年份：2008

资助金额：38.00

项目类别：面上项目

批准号：30800673

批准年份：2008

资助金额：20.00

项目类别：青年科学基金项目

批准号：31270378

批准年份：2012

资助金额：88.00

项目类别：面上项目

批准号：31271660

批准年份：2012

资助金额：70.00

项目类别：面上项目

批准号：31760751

批准年份：2017

资助金额：37.00

项目类别：地区科学基金项目

批准号：51771193

批准年份：2017

资助金额：60.00

项目类别：面上项目

批准号：51874160

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：21371016

批准年份：2013

资助金额：80.00

项目类别：面上项目

批准号：30472004

批准年份：2004

资助金额：20.00

项目类别：面上项目

批准号：11505074

批准年份：2015

资助金额：22.00

项目类别：青年科学基金项目

批准号：51905336

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：51673016

批准年份：2016

资助金额：61.00

项目类别：面上项目

批准号：81772495

批准年份：2017

资助金额：57.00

项目类别：面上项目

批准号：31901193

批准年份：2019

资助金额：23.00

项目类别：青年科学基金项目

批准号：81171904

批准年份：2011

资助金额：60.00

项目类别：面上项目

批准号：61473055

批准年份：2014

资助金额：80.00

项目类别：面上项目

批准号：U1932143

批准年份：2019

资助金额：59.00

项目类别：联合基金项目

批准号：51604255

批准年份：2016

资助金额：21.00

项目类别：青年科学基金项目

批准号：11875146

批准年份：2018

资助金额：62.00

项目类别：面上项目

批准号：51137005

批准年份：2011

资助金额：310.00

项目类别：重点项目

批准号：81070386

批准年份：2010

资助金额：10.00

项目类别：面上项目

批准号：30270098

批准年份：2002

资助金额：25.00

项目类别：面上项目

批准号：29674037

批准年份：1996

资助金额：9.00

项目类别：面上项目

批准号：81173477

批准年份：2011

资助金额：60.00

项目类别：面上项目

相似国自然基金

异质噪声场景语音识别中的结构化深度学习研究

批准号：61603252

批准年份：2016

负责人：钱彦旻

学科分类：F0605

资助金额：22.00

项目类别：青年科学基金项目

基于稀疏表示和字典学习的深度图像序列人体行为识别

批准号：U1504611

批准年份：2015

负责人：宋相法

学科分类：F0605

资助金额：27.00

项目类别：联合基金项目

知识引导的深度学习语音降噪研究

批准号：61876214

批准年份：2018

负责人：张学良

学科分类：F0605

资助金额：62.00

项目类别：面上项目

基于端到端深度学习框架的文本无关副语言语音属性识别研究

批准号：61773413

批准年份：2017

负责人：李明

学科分类：F0605

资助金额：60.00

项目类别：面上项目

语音识别中的稀疏性深度学习

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于小波高阶统计量的数字图像来源取证方法

基于注意力机制和多尺度残差网络的农作物病害识别

基于转置卷积神经网络的路面裂缝识别算法

基于数据手套和神经网络的数字手势识别方法

王东的其他基金

鸡大肠杆菌pilA-ompA融合基因工程菌株的构建与免疫原性研究

基于磨损预测的微纳米复合陶瓷刀具材料微观结构设计及制备研究

车载自组网实时协作定位系统及多数据源融合算法研究

DNA损伤修复基因APE1 RNA干扰提高骨肉瘤抗血管生成治疗敏感性的研究

血管修复与免疫调控治疗老年慢性硬膜下血肿的机制及临床应用研究

Ape1激活突变型p53及其在肝癌放疗抵抗中的协同作用

大规模MIMO信号处理粗粒度可重构计算方法研究

中国黑三棱属(黑三棱科)的分类修订

光波导参量振荡压缩器

波前相位校正抑制模间串扰实现长距离高精度FMF-BOTDR传感

环境友好介质中有机反应的研究

用于癌症诊疗一体化的聚集诱导发光材料的构建及其性能研究

青藏高原水生植物区系地理和植被资源可持续利用

高氮奥氏体不锈钢搅拌摩擦焊接头组织控制与局部腐蚀行为研究

APE1在电离辐射诱导肿瘤细胞mtDNA损伤修复中作用的研究

肠上皮中的PKM2在炎症性肠病的作用及机制研究

TrKA基因调控对BMSCs体内分化的影响及相关机制研究

融合多级语义表达的体育视频事件分析

新型复数算术运算单元设计与VLSI实现

无线网络中高能效的物理层安全信息传输技术研究

基于极限平衡理论的露井联采层状边坡稳定性计算方法

试剂控制的有机硅化合物的不对称反应

质子导体氢泵和氢传感器在铝液无污染脱氢和传感测氢中的应用研究

内源性EPCs干预治疗慢性硬膜下血肿的动物实验及临床研究

聚酰亚胺硅氧烷的合成研究

经食道胃途径经自然腔道内镜手术（NOTES）无菌术机制研究和方法体系的建立

基于瘦素介导的JAK/STAT信号通路调控炎症效应机制研究清肾颗粒对肾间质纤维化干预作用

ALICE/PHOS新读出链路性能研究

基于光学双腔的连续变量相干反馈控制研究

“新零售”下消费者渠道行为演化与路径选择机制研究

高效、宽频压电型能量收集器的设计与研制

高增益自由电子激光新原理新机制的研究

水生植物对高原极端环境适应辐射与生态阈值的研究

具有正性约束的切换系统鲁棒故障检测方法研究

融合仿形飞行与能效优化的丘陵山地植保无人机导航方法研究

蚂蚁对紫堇属早春类短命植物种子散布及种群空间分布格局的影响

催化的有机硅化合物的不对称合成反应

基于目标基因靶向捕获和高通量测序解析麻风易感相关重要通路和关键基因

手性有机硅化合物的合成及其不对称合成反应

中国香蒲属（香蒲科）的分类修订

烯基硅醇的SHARPLESS不对称环氧化反应

叶绿体DNA向核基因组转移的机制研究

大容量高转矩密度多相感应电动机的研究

高产小麦氮-硫互作代谢和调控机制与氮硫营养利用

水文环境变化对江汉湖群大型水生植物腐烂分解的影响及其机制

根层补灌对冬小麦水氮利用的调控机制

microRNAs 在奶牛乳腺上皮细胞抗金黄色葡萄球菌免疫反应中的调控机理

近界面组织调控对SiC颗粒增强7000系铝基复合材料强度和塑性的影响机制

露天煤矿顺倾软岩边坡失稳时空演化机制与稳定性计算方法

高效固态纤维状太阳能电池制备和性能研究

以DNA修复基因APE1为靶点骨肉瘤基因放疗的实验研究

电磁量能器脉冲信号的幅度与时间特征实时提取算法研究

基于温敏材料网格结构的变刚度软体驱动器一体化设计

AFM纳米力学图谱技术研究反应增容共混物界面的微观结构与纳米力学性能

BER失衡超载DNA突变负荷决定肺癌抗PD-1治疗反应及其机制的研究

气候变暖背景下，中亚热带天然林和人工林吸收根有机碳基团分解研究

DNA-PKcs在氧化应激后肿瘤细胞选择存活/凋亡的决定作用及其机制

基于切换方法的网络化系统分布式事件触发控制研究

重离子辐照下基于硅像素探测器的高速闩锁相机原型机研制

微观结构调控强化钛酸盐电化学解离的基础研究

基于深度压缩技术的Hybrid像素探测器读出系统原型机研制

大容量高效集成飞轮储能关键技术基础研究

经自然腔道内镜手术（NOTES）的应用基础研究

中国狐尾藻属的系统分类与适应进化

新型光活性高分子导体的合成和性能研究

三七种质资源化学表征与皂苷合成关键酶基因表达及形态多样性的关联性分析

相似国自然基金