语音识别产品不同于实验室演示系统,能否走向实用取决于在实际应用条件下,满足用户的实际需求。首先,训练集语音样本必须符合使用时的实际应用条件,也就是在预计使用群体(不同年龄和性别,各种口音)中按预计使用环境(各种电话类型和噪音环境)进行训练集的语音样本收集。收集样本充分覆盖实际应用条件的方方面面。建立语音识别声学模型分三个基本部分:特征抽取、模式化分和时间对准。对于我们选取的语音特征参数,需要能够将各类样本的特征参数点完全划分开。对于模式划分,我们需要在混合高斯分布(GMM)计算最大似然值(ML)和K近邻法进行比较。对于时间对准,目前还不够完善,需要认真探索解决。为了认证这一途径的正确性,我们选择0-9十个数字加上*和#所有电话机上的十二个键作为语音识别系统的识别字表,在实际应用条件下,识别率至少达到99%以上,使做成语音识别产品时真正能够走向实用。本项目着重研究实用语音识别系统的关键技术。
{{i.achievement_title}}
数据更新时间:2023-05-31
针对弱边缘信息的左心室图像分割算法
基于改进LinkNet的寒旱区遥感图像河流识别方法
新产品脱销等待时间对顾客抱怨行为的影响:基于有调节的双中介模型
基于直观图的三支概念获取及属性特征分析
基于直觉模糊二元语义交互式群决策的技术创新项目选择
实用专家系统
属性加密实用化关键技术研究
声母和韵母切分的汉语语音识别研究
随机大系统在非李氏意义下的实用稳定性与实用镇定