三维声场中声源水平定位线索感知特性测量与分析

基本信息
批准号:61201340
项目类别:青年科学基金项目
资助金额:25.00
负责人:涂卫平
学科分类:
依托单位:武汉大学
批准年份:2012
结题年份:2015
起止时间:2013-01-01 - 2015-12-31
项目状态: 已结题
项目参与者:TimoItala,谭小琼,王晓晨,王恒,许汉林,王汪,郑翔
关键词:
临界可感知差异感知阈值声源定位空间音频编码双耳线索
结项摘要

The rapidly development of 3D films makes 3D audio and video technology as the frontier and hotspot of information and communication industry. 3D audio system has the feature of more channels and a huge amount of data. To reduce channels and data sizes of 3D audio system by simplifying the system and compressing data is a pressing task that demands prompt resolving. Binaural cues are the important basis for human auditory system to localize sound sources in horizontal plane. But there is significant difference in perceptual sensitivity of binaural cues of sound sources with different azimuth. To the perceptual discrimination of binaural cues, this proposal measures perceptual threshold of binaural cues with multiple directions in azimuth plane. Mathematical interpolation method is used to set up curved surface of threshold based on spatial distribution and frequency characteristics of sound sources. The tranditional research on perceptual threshold of binaural cues is expanded from qualitative description to quantitative analysis. The surface model is used to efficient coding of mulit-channel audio signals in horizontal plane and a quantization method of spatial parameters based on perceptual threshold of binaural cues is proposed. On the condition of equal bitrate to tranditional mono audio coders, excellent reconstructed stereo signals would be obtained by additon of spatial parameter information, with the rate of 8kbps. In comparison to current parametric coder of stereo signal, subjective quality will increase by 10 of MUSHRA score. The research results are going to be instrctive of high-efficiency expression of 3D audio signals.

3D影视的兴起使三维音视频技术成为信息与通信行业的技术前沿和研究热点。三维音频系统声道数多、数据量大。通过简化系统和压缩数据来降低三维音频系统的声道数和数据量,是三维音频系统亟待解决的重要问题。双耳线索是三维声场中人耳对声源水平方位定位的重要依据,但是人耳对不同方位声源的双耳线索的感知敏感度具有较大的差异性。本项目针对双耳线索的感知敏感度特性,在水平面多个方位测量双耳线索的感知阈值;通过数学插值建立基于空间分布和频率特性的双耳线索感知阈值曲面,将传统的双耳线索感知阈值研究由定性描述拓展到定量分析;将该曲面模型应用于水平多声道信号的高效编码,提出基于感知阈值的多声道信号空间参数感知无失真量化方法。在传统单声道编码码率条件下,增加8kbps空间参数信息可获得优质的立体声重建信号。与现有参数立体声编码器相比,重建音质提升10个MUSHRA得分。研究成果对于三维音频信号的高效表达具有指导意义。

项目摘要

双耳线索是人耳对三维声场中水平声源进行定位的重要依据,已被应用于立体声和多声道环绕声编码中,以传统单声道编码码率加上空间参数边信息,即可获得良好的立体声/环绕声音质。人耳对双耳线索的感知敏感度是人类听觉系统的重要特性之一,对于提升编码效率和编码音质具有重要意义。但是,针对双耳线索感知特性的研究存在测量数据零散、分析不全面的问题,导致空间参数冗余难以去除,降低空间音频编码效率和质量。针对上述问题,本项目开展双耳线索临界可感知阈值的测量、分析及应用研究。首先,针对双耳强度差线索ILD和双耳时间差线索ITD的主要作用频率范围,分别在20-15500Hz和20-1720Hz范围内,在7种参考方位值下,完成了上述两种双耳线索的临界可感知差异JND的测量,首次建立了全频带、全方位的双耳线索感知阈值数据库。其次,利用数学插值拟合的方法处理所测得的JND数据,获得JND数据的光滑曲面,分析双耳线索值本身以及信号频率对JND的影响。实验结果揭示了双耳线索JND随声源频率和方位变化的基本规律。最后,项目组开展了双耳线索感知特性在立体声编码中的应用研究。提出了基于感知和分布特性的ILD参数量化算法,通过舍弃感知不重要的频带的空间参数,达到降低码率的目的。与3GPP Eaac+中的参数立体声算法相比,可在保持音质相当的前提下,使得空间参数码率下降约15%。针对AVS-P10频域参数立体声算法在低频段采用强度立体声而导致声像不稳的问题,提出在全频带进行下混和提取空间参数的立体声编码架构,并提出基于频带划分的多量化表算法,以适应不同频带空间参数的变化规律,将立体声编码主观质量提升2.67个MUSHRA分值,同时将编码算法复杂度降低约40%。在成果的应用方面,将改进的AVS-P10立体声算法应用于音频流媒体点播系统;并且与芬兰合作方共同设计了新型养老信息系统中的音频应用方案。在《声学学报》、《中国通信》等重要学术期刊上发表论文8篇,其中SCI检索2篇,EI检索1篇。联合培养博士生1名,培养硕士生7名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
3

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
4

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
5

多空间交互协同过滤推荐

多空间交互协同过滤推荐

DOI:10.11896/jsjkx.201100031
发表时间:2021

涂卫平的其他基金

相似国自然基金

1

直升机声源激发浅海水下声场特性与定位问题研究

批准号:11674349
批准年份:2016
负责人:王光旭
学科分类:A2302
资助金额:69.00
项目类别:面上项目
2

稳健的一阶和高阶谐波声场分析声源定位方法研究

批准号:61471190
批准年份:2014
负责人:陈华伟
学科分类:F0111
资助金额:83.00
项目类别:面上项目
3

振板声源的声源参数对其高强超声场特性的影响

批准号:10574094
批准年份:2005
负责人:周光平
学科分类:A2303
资助金额:32.00
项目类别:面上项目
4

空气中声源激发的浅海声场特性的实验和理论研究

批准号:10523002
批准年份:2005
负责人:彭朝晖
学科分类:A2302
资助金额:120.00
项目类别:专项基金项目