根据二阶差分耳蜗模型及听觉神经的感知特性构造了听觉谱语音特征参数,建立了该参数的提取算法。将该参数取代传统的LPC倒谱特征参数用于TDW中小词汇语音识别系统,在特定人条件下,新方法比传统方法正识率提高5%,在非特定人和有噪情况下,前者比后者分别提高了25%和30%。采用VQ对该特征参数进行量化,形成量化空间的特征表示表达式,并建立了平均速率为2.4Kbps的可变速率声码系统。在每帧最多24个参数并采用帧间平滑技术的条件下,合成语音完全可懂 ,除自然度有所下降外,合成语音仍保持较高的清晰度。在语音识别与语音编码的实验中,新的特征参数比传统LPC参数在语音表征能力、鲁棒性及抗噪性等方面均表现了更好的性能。
{{i.achievement_title}}
数据更新时间:2023-05-31
结直肠癌免疫治疗的多模态影像及分子影像评估
智能煤矿建设路线与工程实践
含饱和非线性的主动悬架系统自适应控制
城市生活垃圾热值的特征变量选择方法及预测建模
基于卷积神经网络的JPEG图像隐写分析参照图像生成方法
人工脑的信息处理新神经网络模型研究
听觉神经网络模型理论与应用研究
人工耳蜗植入者听觉系统对基音信息处理的若干问题研究
用神经网络研究基于听觉系统模型的语音识别