Ispired by human ears, we simplified mathematical expression of the physiology and psychology of the human positioning mechanism for engineering applications, and extend the application to the field of microphone array localization. To enhance the algorithm performance in reverberant、 multiple sound sources and far distance environment under the positioning. Modeled on the human auricle reflex positioning mechanism, we design near-sensor reflective surface of the microphone array and research the topology of the microphone array distribution and localization algorithm; for multiple sound sources, reverberant environment, combined with the study of Blind Channel Identification and nearly sensors the reflective surface features,we develope multi-scale double array of voice positioning algorithm by utilizing corner retro-reflector phenomenon, and design a double array topology, and propose a deviate function that change linearly with the outer layer topology changes. Modeled on the positioning mechanism of the head function, design helmets wear microphone array to improve the remote positioning accuracy, ang research optimal semicircular helmet distributed microphone array topology and localization algorithms. according to the actual physical acoustic effects of diffraction and reflection on the helmet towards different bands, we design a localization algorithm which can take advantage of this spatial information of the topology and the positioning algorithm. With Subspace technology, combined with the voice of non-white, non-stationary, research location algorithm for comprehensive utilization of the strength information and delay information
参考人类双耳定位的生理学和心理学机理,将其简化为可工程应用的数学表达,并扩展应用到麦克风阵列定位领域,以提升算法在混响环境、多声源、远距环境下的定位性能。仿照人的耳廓反射定位机理,设计具有近传感器反射面的麦克风阵列,研究该种麦克风阵列的拓扑分布和定位算法;针对多声源、混响环境下,结合研究信道盲辨识技术和近传感器反射面特性,开发多尺度双层阵列的语音定位算法。利用墙角内的回复反射现象,设计一种双层阵列拓扑结构,并提出一种随着外层拓扑的变化线性变化偏离度函数。仿照人头部遮挡定位机理,设计头盔佩戴式麦克风阵列,以提高麦克风阵列的远距定位精度为目的,研究分布在半圆形头盔上的麦克风阵列的定位算法和最优拓扑分布,根据头盔对声波不同波段的衍射和反射的实际物理作用,设计一种可充分利用这种空间信息的拓扑结构和相应的定位系统。 采用子空间技术,结合语音的非白、非平稳性,研究可综合利用强度信息和时延信息的定位框架
本项目获得了三类研究成果。基于头盔式麦克风阵列的定位算法,混响环境下双(单)麦克风多声源定位算法,并扩展研究了视频图像动态提取方法。基于头盔式麦克风阵列对不同频段声音的不同物理作用,提出了针对低频段的基于衍射时延的到达方位角估计算法D-TDOA,针对高频段的基于强度差的到达方位角估计算法,综合高低频信息提出了综合强度差和时延差的头盔式麦克风阵列定位系统,并申请了专利。面向混响环境麦克风数量欠定情况,本项目利用压缩感知框架,突破三角定位的物理限制,给出了双(单)麦克风混响环境下的多声源定位算法,该算法将麦克风接收房间混响后声源的过程看做声音经过房间冲激响应压缩后的压缩观测过程,当房间结构已知时,可以构造压缩观测矩阵,利用块稀疏优化进行声源位置搜索,房间结构可以利用较少声源时的虚声源进行估计, 项目仿真验证了双(单)麦克风混响环境下的四声源定位,验证了算法的可行性。项目扩展研究视频图像动态提取方法,提出了一种基于PCA和混合的关键帧提取算法,可以在不影响人眼动态判断的前提下大大压缩数据量。项目还扩展研究了基于二进制红外线阵列的多人定位问题,该方法基于天棚上分布的二进制红外阵列,可以对房间内多人进行定位,并可判断人体姿态,这可以作为麦克风定位系统的的有益补充。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例
基于多模态信息特征融合的犯罪预测算法研究
基于分形维数和支持向量机的串联电弧故障诊断方法
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
基于麦克风阵列的语音增强和定位方法研究
基于声音-视觉声源定位的麦克风阵列语音增强技术研究
人耳听觉机理与语音压缩编码中应用
基于麦克风阵列的多信道语音增强技术的研究