基于非线性语音谱分析的单通道语音增强研究

基本信息

批准号：61302126

项目类别：青年科学基金项目

资助金额：23.00

负责人：王杰

学科分类：

依托单位：广州大学

批准年份：2013

结题年份：2016

起止时间：2014-01-01 - 2016-12-31

项目状态：已结题

项目参与者：郑成诗,张承云,蔡阳生,王世伟,严周颖,高俊涛

关键词：

助听语音增强语音修复语音处理

结项摘要

There are two basic prolems existed in the state-of-the-art single-channel speech enhancement algorithms. First, the bias and the variance of the spectral estimator may introduce both musical noise and audible speech distortion. Second, the existing noise estimators could not track non-stationary noise in a fast way, which may result in greatly reducing the amount of noise reduction. To solve these two problems, we have proved that some non-stationary noise components could be suppressed without introducing audible speech disortion by using cepstrum-based postprocessing scheme, where this project will further study non-linear speech spectrum analysis-based single-channel speech enhancement. Compared with the conventional single-channel speech enhancement, the proposed method that uses both cepstral analysis and reassigned spectrogram has at least two advantages. First, the noise components can be separated from the speech components by using cepstral analysis. Second, we can fully utilize both the temporal correlation between successive speech frames and the frequency correlation between adjacent bands with the help of reassigned spectrogram. This project will study theoretical propertis of cepstral coefficients of the speech, where the thoeretical results can be used to improve the noise tracking capablity and applied to suppress non-stationary noise components. This project will further study the reassigned spectrogram in theory to further suppress the non-stationary noise components, which is based on the temporal correlation and the frequency correlation of the speech.By this study, we intend to improve the performance of the single-channel speech enhancement in real environment and make it more applicable in practical situation.

单通道语音增强面临两个根本性问题：一是谱估计方差既可能产生"音乐噪声"，也可能造成语音失真；二是当前的噪声估计算法难以跟踪非平稳态噪声，低估噪声会导致大量的噪声残留。针对这两个根本性问题，我们验证了倒谱后处理能在不增加语音失真的情况下抑制部分非平稳态噪声，本项目将进一步开展基于非线性语音谱分析的单通道语音增强研究。相比于基于线性谱估计的传统方法，采用基于倒谱分析和重分配谱图的非线性语音谱估计具有如下优势：首先，利用倒谱分析可以将噪声从语音信号分离出来；其次，利用重分配谱图可以充分利用语音帧间和频间相关性。本项目拟对语音倒谱进行理论研究，研究其统计特性，该理论研究成果既应用于提高噪声跟踪性能，又应用于后处理抑制残留的非平稳态噪声。同时，进一步对重分配谱图进行理论研究，利用语音帧间和频间相关性抑制非平稳态噪声。该研究的理论成果将解决实际环境中的单通道语音增强问题，为实用化扫清障碍。

项目摘要

单通道语音增强面临两个根本性问题：一是谱估计方差既可能产生“音乐噪声”，也可能造成语音失真；二是当前的噪声估计算法难以跟踪非平稳态噪声，低估噪声会导致大量的噪声残留。针对这两个根本性问题，本项目开展了基于非线性语音谱分析的单通道语音增强研究。相比于基于线性谱估计的传统方法，采用基于倒谱分析和重分配谱图的非线性语音谱估计具有如下优势：首先，利用重分配谱图可以充分利用语音帧间和频间相关性；其次，利用倒谱分析可以将噪声从语音信号分离出来。本项目对重分配谱图进行理论研究，利用了瞬时信道频率（CIF: Channelized Instantaneous Frequency）和本地群延迟（LGD: Local Group Delay），反映了语音信号帧间和频间的特性。在多种噪声背景下的测试结果表明基于重分配谱图分析的算法能提高先验信噪比算法的估计性能。进一步，通过倒谱分析和重分配谱图相结合提升处理非平稳噪声的性能，能更好地抑制浊音的谐频成分，并减少部分较强的噪声成分误判为语音信号的情况，避免噪声功率谱过估和低估的情况。更进一步，针对先验信噪比单通道语音增强算法在信噪比较低时语音高次谐波失真较为严重的情况，本项目提出了基于二次谱谐波重构的先验信噪比估计方法,对增强后的信号进行二次谱处理，以加强语音信号的周期性,再进行谐波重构，提升谐波分量。实验研究表明，该算法在低信噪比时能够有效地增强语音谐波分量，相对于传统的先验信噪比估计算法有较少的语音失真。本项目通过非线性方法解决单通道语音增强的固有问题，提高了增强后语音的可懂度，从而推动语音增强的研究向更加实用化的方向发展。本项目的研究成果可以应用于目前的绝大多数语音通信系统，一方面降低环境噪声的干扰，另一方面提高语音的可懂度和自然度。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2018

DOI：

发表时间：2022

DOI：10.19538/j.cjps.issn1005-2208.2021.06.15

发表时间：2021

DOI：10.19734/j.issn.1001-3695.2020.12.0564

发表时间：2021

DOI：10.15957/j.cnki.jjdl.2020.04.014

发表时间：2020

王杰的其他基金

批准号：59302018

批准年份：1993

资助金额：6.50

项目类别：青年科学基金项目

批准号：41602317

批准年份：2016

资助金额：16.00

项目类别：青年科学基金项目

批准号：61074042

批准年份：2010

资助金额：32.00

项目类别：面上项目

批准号：31101589

批准年份：2011

资助金额：26.00

项目类别：青年科学基金项目

批准号：11873051

批准年份：2018

资助金额：63.00

项目类别：面上项目

批准号：69988003

批准年份：1999

资助金额：10.00

项目类别：专项基金项目

批准号：81270861

批准年份：2012

资助金额：70.00

项目类别：面上项目

批准号：31570391

批准年份：2015

资助金额：25.00

项目类别：面上项目

批准号：11802335

批准年份：2018

资助金额：22.00

项目类别：青年科学基金项目

批准号：60674035

批准年份：2006

资助金额：25.00

项目类别：面上项目

批准号：31771193

批准年份：2017

资助金额：57.00

项目类别：面上项目

批准号：61374155

批准年份：2013

资助金额：81.00

项目类别：面上项目

批准号：69573001

批准年份：1995

资助金额：6.00

项目类别：面上项目

批准号：81341130

批准年份：2013

资助金额：10.00

项目类别：专项基金项目

批准号：21105116

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：11701243

批准年份：2017

资助金额：19.00

项目类别：青年科学基金项目

批准号：21274115

批准年份：2012

资助金额：82.00

项目类别：面上项目

批准号：81001172

批准年份：2010

资助金额：20.00

项目类别：青年科学基金项目

批准号：11672264

批准年份：2016

资助金额：68.00

项目类别：面上项目

批准号：41001274

批准年份：2010

资助金额：18.00

项目类别：青年科学基金项目

批准号：51403062

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：41571060

批准年份：2015

资助金额：80.00

项目类别：面上项目

批准号：11472242

批准年份：2014

资助金额：90.00

项目类别：面上项目

批准号：51602269

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：31701855

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：21076081

批准年份：2010

资助金额：35.00

项目类别：面上项目

批准号：81601893

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

批准号：41305021

批准年份：2013

资助金额：24.00

项目类别：青年科学基金项目

批准号：69873002

批准年份：1998

资助金额：10.00

项目类别：面上项目

批准号：11803080

批准年份：2018

资助金额：28.00

项目类别：青年科学基金项目

批准号：11373029

批准年份：2013

资助金额：86.00

项目类别：面上项目

批准号：31200411

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：41171063

批准年份：2011

资助金额：74.00

项目类别：面上项目

批准号：11002123

批准年份：2010

资助金额：22.00

项目类别：青年科学基金项目

批准号：61801228

批准年份：2018

资助金额：24.00

项目类别：青年科学基金项目

批准号：81672741

批准年份：2016

资助金额：58.00

项目类别：面上项目

批准号：31772020

批准年份：2017

资助金额：60.00

项目类别：面上项目

批准号：21904100

批准年份：2019

资助金额：25.00

项目类别：青年科学基金项目

批准号：81303061

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：21376080

批准年份：2013

资助金额：80.00

项目类别：面上项目

批准号：20804030

批准年份：2008

资助金额：18.00

项目类别：青年科学基金项目

批准号：39070633

批准年份：1990

资助金额：3.50

项目类别：面上项目

批准号：61774016

批准年份：2017

资助金额：63.00

项目类别：面上项目

批准号：40801031

批准年份：2008

资助金额：25.00

项目类别：青年科学基金项目

相似国自然基金

基于深度学习的单通道语音混响消除技术研究

批准号：61671381

批准年份：2016

负责人：张晓雷

学科分类：F0111

资助金额：58.00

项目类别：面上项目

基于概率声管模型的单通道语音分离研究

批准号：61473168

批准年份：2014

负责人：欧智坚

学科分类：F0605

资助金额：83.00

项目类别：面上项目

基于语音增强的鲁棒性语音识别方法研究

批准号：62001446

批准年份：2020

负责人：屠彦辉

学科分类：F0117

资助金额：16.00

项目类别：青年科学基金项目

基于零空间追踪的单通道语音分离方法研究

批准号：61861005

批准年份：2018

负责人：胡维平

学科分类：F0111

资助金额：39.00

项目类别：地区科学基金项目

基于非线性语音谱分析的单通道语音增强研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

神经退行性疾病发病机制的研究进展

融合字符串特征的维吾尔语形态切分

腹主动脉瘤腔内修复术后并发症相关危险因素研究

基于边信息的高光谱图像恢复模型

超越“星球城市化”:中国城市研究的新方向

王杰的其他基金

宽禁带Ⅱ-Ⅵ族半导体薄膜的外延生长及掺杂研究

三维隐式对流域物质点法理论及其在岩土非连续变形问题中的应用

基于能量的结构保持复杂动态电力系统稳定性分析与鲁棒控制研究

低温贮藏下杏鲍菇质地木质化劣变的相关基因鉴定与功能分析

利用深度学习重构本地宇宙结构演化

ICF中宽带激光高效率谐波转换技术研究

肽基脯氨酰异构酶B在2型糖尿病β细胞内胰岛素原稳态失衡中作用的研究

中国大鲵性选择与交配制度的机制研究

变参数挠性航天器姿态控制方法研究

结构保持随机网络电力系统的非线性鲁棒自适应控制研究

基于脑网络研究脑内长期乙醛蓄积诱发脑损伤的多层次表征

基于微分代数Hamilton系统及其周期解理论的互联电网低频振荡分析与控制

置换群与有限几何在保密学中的应用

Cx43在心理应激引发心性猝死中的表达特征和法医学检测技术研究

小鼠大脑中能量代谢和神经传递动力学参数的NMR定量测定方法及应用

时间周期Lotka-Volterra竞争系统的空间扩张行为

纳米结构聚吡咯的脉冲合成、结构调控和储能性能研究

DARC在基底细胞样乳腺癌中作用机制的研究

铁电材料电热效应的应变调控

遥感图像分类中构造和使用具有不变性的特征的相关问题研究

环糊精聚电解质刷负载纳米金属选择性催化水相Heck偶联反应及其机理研究

青藏高原东缘极高山地(贡嘎山和四姑娘山)第四纪冰川年代学与冰期环境重建研究

应变梯度对铁电材料力电耦合性能的调控

C/C复合材料与Ti3Al基合金TLP扩散连接多界面设计、组织结构演变及应力缓解机理研究

入侵生物马铃薯甲虫肠道微生物对寄主植物抗虫防御的调控及其机理

钙和碱金属的协同催化煤气化制富氢气体机理的研究

基于电测法和三维有限元分析的股骨转子下骨折内固定选择策略的研究

基于场致电离荷电的大气细颗粒物粒径谱测量方法研究

群论与组合数学对密码和认证码的应用

基于IPv6+SDN架构的天文数据传输网络关键技术研究

模拟宇宙空洞中的结构形成

大鲵洞穴种群的保护遗传学研究

祁连山东、西段第四纪冰川发育模式对比研究

铁电/铁磁复合薄膜多场耦合特性的相场研究

面向星载MIMO-SAR同频干扰抑制的多维正交信号技术研究

SOX6基因引起细胞衰老的机制研究

PePAL1和Pe4CL3在杏鲍菇采后两次木质化中的转录调控机制研究

光激活功能核酸引导的上转换长余辉探针用于高灵敏眼底新生血管成像

基于PET技术对针刺督脉腧穴治疗不同脑老化疾病的异病同治机理研究

低阶煤加压催化气化制甲烷的化学过程研究

微/纳米结构导电高分子复合物的制备与电化学性能研究

藏山羊种质测定

高效柔性摩擦纳米发电机的结构设计与性能优化

达里加山地区第四纪冰川演化序列与年代学研究

相似国自然基金