语音增强是语音信号处理的一个重要研究课题,具有极其广泛的应用前景。根据处理目标的不同,语音增强技术可以分为:以提高语音质量为目标的增强算法和以提高语音可懂度为目标的增强算法。当前的语音增强技术对噪声抑制、提高语音质量有显著效果,但对语音可懂度的提高没有效果,甚至往往降低了语音可懂度。本项目拟提出一个基于双耳听感知机制的语音可懂度增强算法,其利用双耳信息构造空、时、频二元掩模,从而提高语音可懂度和保持双耳信息(听觉场景)。在对双耳听感知机制进行研究的基础上,我们提出基于互相关模型的空间二元掩模构建方法和基于等化-消除模型的时频二元掩模构建方法。在此基础上,构建空时频二元掩模,并应用于双耳带噪信号实现语音可懂度的增强,同时保留原有的听觉场景信息。本项目的特色和创新在于:提高了语音可懂度和保留了双耳信息。研究成果可以进一步应用于先进语音通信系统、远程会议系统、双耳助听器等。
语音增强是语音信号处理的一个重要研究课题,具有极其广泛的应用前景。根据处理目标的不同,语音增强技术可以分为:以提高语音质量为目标的增强算法和以提高语音可懂度为目标的增强算法。当前的语音增强技术对噪声抑制、提高语音质量有显著效果,但对语音可懂度的提高没有效果,甚至往往降低了语音可懂度。本项目以双耳听觉感知机制的研究为基础,提出了两阶段双耳语音增强算法,实现了目标语音信号的增强和空间方位信息的保持;提出了目标语音信号的方位估计方法,实现了在噪声混响环境下,对目标语音信号到来方向的准确估计。调查研究了语言信息对语音增强算法的语音可懂度的影响,实验结果表明语言信息对语音增强技术有着重要的潜在影响,语音信号处理算法的设计与优化应该考虑语言本身的特性。发表了10多篇SCI/EI论文。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
低轨卫星通信信道分配策略
自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例
F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度
基于汉语语音可懂度的噪声品质评价研究
基于稀疏时频分析与二元掩蔽估计的耳语音可懂度增强研究
说话人噪声对抗机理研究与窄带语音噪声自适应可懂度增强技术
基于言语可懂度理论的声电双模态刺激方法及模式研究