研究如何利用案犯留下的电话语音信息,辨认罪犯的性别、年龄、籍贯等,最终达到破案的目的。为此,我们将选择语音辨识中的若干关键技术问题,作为本课题研究的重点内容。具体为:(1)构建一个发音人数量有限,语音样本数据有限,而能反映中国地域方言特征的电话语音数据库;(2)提出一种新的动态半监督学习算法,自动获取方音各地方言特性的语音发音基元,并利用该基元对语音信号进行自动切分;(3)针对识别基元提出一种韵律特征与倒谱特征相融合的语音新特征;(4)提出一种分类器融合新方法,该方法,一方面将基元帧特征矢量通过曲线拟合方法实现动态时间规整,获得包含地域和时域信息的等维特征矢量,并送支撑矢量机进行学习和识别;另一方面,提出一种新的渐变隐马尔可夫模型,该模型可根据语音信号的非稳态特点,及时调整模型参数,从而达到更好地辨识的目的。两者按照分类器融合方法,可得到发音人的性别、年龄和地域信息。
{{i.achievement_title}}
数据更新时间:2023-05-31
一种基于多层设计空间缩减策略的近似高维优化方法
二维FM系统的同时故障检测与控制
扶贫资源输入对贫困地区分配公平的影响
现代优化理论与应用
基于直观图的三支概念获取及属性特征分析
新一代汽车中智能语音处理若干关键技术研究
电话信道的自然语音语言辨识技术研究
汉语耳语音感知中关键技术研究
藏语语音合成关键技术研究