基于压缩感知的单通道混合语音分离理论及算法研究

基本信息
批准号:61302152
项目类别:青年科学基金项目
资助金额:24.00
负责人:郭海燕
学科分类:
依托单位:东南大学
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:吴镇扬,赵小燕,李拟珺,丁佳佳,赵枭雄
关键词:
限制等距特性稀疏分解语音分离压缩感知正交匹配追踪
结项摘要

Compressed sensing (CS), emerged in recent years, can provide a new way to solve the problem of single-channel Speech Separation(SCSS), which is a vital issue of speech signal processing. Therefore, we put our research focuses on CS-based SCSS techniques. The research includes two parts. One is to discuss the conditions of exact CS-based separation, including new CS-based SCSS modelling, the analysis of conditions in which the exact separation problem is equivant to the exact recovery problem and the analysis of exact recovery conditions.The other is to design practical CS-based separation methods, including an adaptive basis construction algorithm suitable for small-scale training data,a fast CS-SCSS algorithm based on improved stagewise orthogonal matching pursuit and a double separation scheme for unvoied/voiced speech mixture. Our achievements in this program can be widely applied to speech enhancement, robust speech recognition, robust speaker recognition, teleconference, hearing aid design and so on.

一直以来,单通道混合语音分离都是语音信号处理的重要研究方向。近几年来出现的研究热点—压缩感知,为单通道混合语音分离的研究提供了新的思路。本项目先基于压缩感知,研究单通道混合语音准确分离的理论条件,包括:新的基于压缩感知的单通道混合语音分离建模方法,准确分离和准确重构的等价条件分析和准确重构条件的理论分析。在此理论基础上,本项目还研究设计实用的基于压缩感知的单通道混合语音分离算法,包括:适用于小规模训练数据的语音信号自适应稀疏基的构造算法,基于改进阶梯正交匹配追踪的快速分离算法,和针对含清音混合语音帧的双重分离方案。本项目的研究成果可广泛用于语音增强、鲁棒语音识别、鲁棒说话人识别、电话会议、助听器设计等领域。

项目摘要

语音分离一直是语音信号处理中的重要研究方向,可作为前端提高语音信号处理系统的鲁棒性。压缩感知(Compressed sensing, CS)理论研究基于低维观测信号重构高维原始信号,为欠定语音分离提供了新的研究思路。因此,本课题研究基于CS理论,研究单通道混合语音分离中的理论和实用算法。具体研究内容包括:鉴于CS理论中观测信号与单通道混合语音信号数学表达式上的一致性,建立基于CS的单通道混合语音分离模型;提出了基于字典更新的正交匹配追踪算法(dictionary-updated orthogonal matching pursuit, DUOMP)算法,在每次迭代中,对残差和原子都进行更新,使得更新的字典原子与更新的残差在时域结构上更匹配;对具有显著时域结构特征的混合语音帧,构建基于时域结构信息的自适应联合字典,以区分不同类型的混合语音帧;构造基于基频状态的子字典,对同一说话人的不同语音进行区分;提出了基于匹配权系数选择的搜索优化重构算法,以减少子字典间的交叉表示;提出了基于帧间相关性,对分离效果差的帧进行分离校正。课题组开展的研究工作为单通道混合语音分离的研究提供了新的途径,研究成果可广泛用于可广泛用于语音增强、鲁棒语音识别、鲁棒说话人识别、电话会议、助听器设计等领域。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
2

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
3

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

栓接U肋钢箱梁考虑对接偏差的疲劳性能及改进方法研究

DOI:10.3969/j.issn.1002-0268.2020.03.007
发表时间:2020
4

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

基于ESO的DGVSCMG双框架伺服系统不匹配 扰动抑制

DOI:
发表时间:2018
5

混采地震数据高效高精度分离处理方法研究进展

混采地震数据高效高精度分离处理方法研究进展

DOI:10.3969/j.issn.1000-1441.2020.05.004
发表时间:2020

相似国自然基金

1

基于概率声管模型的单通道语音分离研究

批准号:61473168
批准年份:2014
负责人:欧智坚
学科分类:F0605
资助金额:83.00
项目类别:面上项目
2

基于零空间追踪的单通道语音分离方法研究

批准号:61861005
批准年份:2018
负责人:胡维平
学科分类:F0111
资助金额:39.00
项目类别:地区科学基金项目
3

压缩感知中采样与重建的理论及算法研究

批准号:11171336
批准年份:2011
负责人:许志强
学科分类:A0503
资助金额:36.00
项目类别:面上项目
4

基于压缩感知的鲁棒性语音情感识别研究

批准号:61203257
批准年份:2012
负责人:张石清
学科分类:F0605
资助金额:24.00
项目类别:青年科学基金项目