Mobile robot auditory system is an important way for friendly interaction between a robot and external objects. The direction and distance of a sound source can be estimated by the perceptive differences of two microphones to the sound source. However, the movement of a mobile robot will lead to continuous changing of the mounted microphone array's position and posture, which brings about many new challenges to the existing approaches. When a robot is moving, high computational complexity of present multiple sound sources localization algorithm can't satisfy the real time requirement in continuous localization. This project researches the microphone array topology with small size which can be conveniently carried on various mobile robot platforms. For a real-time and robust multiple sources localization method, a few microphones based clustering triangulation localization algorithm is used. Then, a dynamic cross-correlation warping technology is introduced, which can effectively estimate the time delay from the microphone signals with inconsistent spatial constraints. The effectiveness of the proposed sound source localization method mentioned above will be tested by many offline and online experiments in HRI environments including mobile robots and speakes.
移动机器人听觉系统是实现机器人与环境目标自然、友好交互的重要途径,基于麦克风阵列的声源定位方法利用不同麦克风对同一声源信号的感知差异实现声源方位和距离的计算。移动机器人本体运动会造成机载麦克风阵列空间位置和姿态的连续变化,对现有的定位方法和系统形成了新的挑战- - 多声源定位算法复杂度高难以满足机器人运动中连续定位的实时性要求。本项目设计便于搭载在移动机器人平台上的小型麦克风阵列拓扑结构;研究支持小型麦克风阵列三角定位的实时、鲁棒多声源定位技术;提出动态信号互相关规整方法,从不一致的信号空间约束中提取有效的时延信息。通过移动机器人对周围说话人进行听觉定位的大量实验,验证上述声源定位方法的有效性。
声源定位技术在机器人听觉、人机交互领域有着重要的应用,它一般是声源分离、自动语音识别、说话人识别的前端。机器人听觉声源定位是指机器人利用搭载在机器人上或者外部设备上的麦克风阵列定位出声源的相对位置。双耳定位则是期望机器人能够像人一样仅仅利用两个传声器完成声源定位。简而言之,本课题的研究工作可概括如下:1)提出了几种不同的适合移动机器人搭载的小型麦克风阵列设计方案。小型化的麦克风阵列有利于搭载在不同类型的移动机器人平台上,方便移植,并且麦克风数量的减少有助于降低成本和算法计算复杂度。本项目采用2‐4 个麦克风,分析不同的阵列结构对各类机器人声源定位性能的影响。 2)提出了基于时延补偿和双耳匹配滤波的声源定位算法。首先,时延补偿分别在时域和频域用于估计双耳时间差和能量差,并采用一致性函数选择可靠的信号帧以减小时延估计的方差。其次,双耳匹配滤波被提出用来描述双耳信号之间的差异信息,其与模板间的相似性可被用来定位。再次,利用贝叶斯分层的搜索策略确定声音源的转向角和俯仰角,有效地降低了系统的时间复杂度。 3)提出了基于时延补偿和平移主成分分析的双通道语音增强算法,利用带后置滤波器的波束形成能够抑制方向性噪声的优点提高了声源的可理解度,为人机交互提供了便利。 4)提出了基于小型麦克风阵列的实时多声源和移动声源定位算法。针对空间平稳噪声和相关高斯噪声,分别采用谱加权的广义互相关和四阶累积量的时延估计方法。基于到达时间差的多声源定位,主要在于消除时间差对的混淆。移动声源定位,可以应用扩展卡尔曼滤波的跟踪预测性质解决。通过实验平台检验了上述方法的有效性,达到了预期的技术和成果指标。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于一维TiO2纳米管阵列薄膜的β伏特效应研究
倒装SRAM 型FPGA 单粒子效应防护设计验证
Ordinal space projection learning via neighbor classes representation
基于纳米铝颗粒改性合成稳定的JP-10基纳米流体燃料
基因表达数据中的局部模式挖掘研究综述
基于小型麦克风阵列的声源定位方法研究
分布式麦克风阵列声源定位算法研究
基于声音-视觉声源定位的麦克风阵列语音增强技术研究
基于麦克风阵列的语音增强和定位方法研究