基于麦克风阵列的语音增强技术是近年来语音信号处理领域的一个研究热点,在语音通信、语音识别等领域具有广泛的应用价值。高性能的麦克风阵列语音增强技术通常是基于大麦克风阵(多阵元、大阵列孔径)来实现,从而制约了其在诸如桌面多媒体语音通信、车载话音通信等免提、便携式高质量通信终端的推广应用。本项目针对以上不足,研究一种基于小麦克风阵(少阵元、小阵列孔径)的语音增强技术。研究内容包括:1)小麦克风阵虚拟阵元扩充方法及有效阵列孔径加大方法的研究;2)虚拟大麦克风阵列高分辨多声源定位方法的研究;3)利用双耳听觉的声源方位特征信息进行目标声源定位补偿和校正方法的研究;4)基于声源定位参数估计约束及虚拟阵列的自适应波束形成语音增强新方案的研究。本项目的研究涉及语音/声学信号处理、阵列信号处理等学科领域,其研究成果能克服基于声源定位的麦克风阵语音增强技术应用受限的不足,因此该研究具有重要的理论意义和实用价值。
. 虚拟大麦克风阵在本项目中意即由2-3个麦克风阵元构成的小孔径麦克风阵虚拟而成,使其功效与大孔径麦克风阵相当。. 因此,本项目首先针对虚拟大麦克风阵的虚拟阵元生成及虚拟阵列的构造研究,从空间重采样及高级累计量的角度出发并结合宽带信号的超分辨波达方向估计方法,提出了多个虚拟阵元构造及阵列孔径扩展的方法;基于构造的虚拟阵列,通过对多声源波达方向估计算法的研究,理论分析和实验结果均验证了虚拟阵列构造的有效性。研究成果为仅有2-3个阵元的小孔径麦克风阵的性能提升探索出一条新路子。其次,基于声源定位的语音增强方案的研究探索也取得一定成果。. 同时,在仅基于两个麦克风的小孔径麦克风阵列研究探索方面,力图借助声场景分析技术,利用语音信号的时频稀疏性、人耳听觉掩蔽效应以及人耳听觉注意机制,探索多声源定位的高性能方法,从另一种意义上达到多阵元大孔径麦克风阵的声源定位效果。此外,基于该研究成果,提出了多种基于声源定位的目标语音提取或欠定语音盲分离等语音增强方案,仿真实验结果均表明了提出方案的有效性。. 接着,设计实现了基于FPGA、以太网、PC的16通道高精度麦克风阵语音实时采集及处理实验研究验证平台。该平台的成功搭建对虚拟大麦克风阵或二阵元的小麦克风阵的声源定位方案及其关联的语音增强方案的性能评估、计算复杂度评估等均具有很高的研究使用价值。特别地,该研究平台在对声源定位及相关语音增强方案的实际应用适应性研究及优化方面是缺一不可的研究平台。. 最后,基于该16通道高精度麦克风阵语音实时采集平台,完成了声源定位部分方案的DOA实时估计以及基于二阵元的语音增强方案的实时实现。.
{{i.achievement_title}}
数据更新时间:2023-05-31
玉米叶向值的全基因组关联分析
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究
硬件木马:关键问题研究进展及新动向
基于SSVEP 直接脑控机器人方向和速度研究
基于声音-视觉声源定位的麦克风阵列语音增强技术研究
基于麦克风阵列的语音增强和定位方法研究
基于麦克风阵列的多信道语音增强技术的研究
近场宽带麦克风阵列语音增强方法及阵列优化拓扑结构的研究