互联网上的海量音乐信息促使产生了进行音乐自动匹配的数字音频指纹技术。但是现阶段该技术的典型算法与人耳识别功能相比仍然存在巨大缺陷,例如无法在巨大环境噪音中识别出微弱的歌曲,也不能识别同一歌曲的不同演奏版本。其根源在于设计的指纹在失真较强的情况下不够鲁棒,对于不同版本的歌曲在时频发生较大变化时失去稳定性,而且现有算法都无法直对MP3压缩格式的音乐进匹配。针对以上问题本课题致力于以下三方面研究:1.利用半阶音符类Chroma上的能量分布对噪声等各种失真具有强鲁棒性,能够在本质上反映旋律与和声进行,且与歌曲版本无关的性质计算具有统计意义的音频指纹,进行同一歌曲不同版本间的准确匹配。2.运用小波分析进行音乐边缘提取,利用其在较大时频变化下仍能保持的高度稳定性进行同一歌曲不同版本间的匹配。3.设计谱质心、能量比等MPEG压缩域上具有一定统计意义的音频特征作为指纹来直接进行MP3压缩格式音乐的匹配。
{{i.achievement_title}}
数据更新时间:2023-05-31
武功山山地草甸主要群落类型高光谱特征
岩石/结构面劣化导致巴东组软硬互层岩体强度劣化的作用机制
基于颗粒阻尼的变频空调压缩机管路减振设计
IV型限制酶ScoMcrA中SRA结构域介导的二聚体化对硫结合结构域功能的影响机制
高超声速流动中噪声与湍流度的关系
巨噬细胞通过外泌体/XRN1通路降解胰腺导管上皮细胞BRCA1/2 mRNA引发基因组不稳定的机制
基于内容的音频信息检索关键技术研究
基于Web的音频识别与检索关键技术研究
音乐旋律提取关键技术研究及其在音乐借用识别中的应用
引入情绪认知脑机制的音乐情绪分类检索关键技术研究