互联网上的海量音乐信息促使产生了进行音乐自动匹配的数字音频指纹技术。但是现阶段该技术的典型算法与人耳识别功能相比仍然存在巨大缺陷,例如无法在巨大环境噪音中识别出微弱的歌曲,也不能识别同一歌曲的不同演奏版本。其根源在于设计的指纹在失真较强的情况下不够鲁棒,对于不同版本的歌曲在时频发生较大变化时失去稳定性,而且现有算法都无法直对MP3压缩格式的音乐进匹配。针对以上问题本课题致力于以下三方面研究:1.利用半阶音符类Chroma上的能量分布对噪声等各种失真具有强鲁棒性,能够在本质上反映旋律与和声进行,且与歌曲版本无关的性质计算具有统计意义的音频指纹,进行同一歌曲不同版本间的准确匹配。2.运用小波分析进行音乐边缘提取,利用其在较大时频变化下仍能保持的高度稳定性进行同一歌曲不同版本间的匹配。3.设计谱质心、能量比等MPEG压缩域上具有一定统计意义的音频特征作为指纹来直接进行MP3压缩格式音乐的匹配。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
主控因素对异型头弹丸半侵彻金属靶深度的影响特性研究
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
三级硅基填料的构筑及其对牙科复合树脂性能的影响
面向工件表面缺陷的无监督域适应方法
巨噬细胞通过外泌体/XRN1通路降解胰腺导管上皮细胞BRCA1/2 mRNA引发基因组不稳定的机制
基于内容的音频信息检索关键技术研究
基于Web的音频识别与检索关键技术研究
音乐旋律提取关键技术研究及其在音乐借用识别中的应用
引入情绪认知脑机制的音乐情绪分类检索关键技术研究