基于电话语音的维吾尔语说话人识别研究

基本信息
批准号:61063024
项目类别:地区科学基金项目
资助金额:28.00
负责人:吾守尔·斯拉木
学科分类:
依托单位:新疆大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:达瓦·伊德木草,依皮提哈尔·麦麦提,努尔买买提·尤鲁瓦斯,候勇,郏新颜,王飞飞,许国娟
关键词:
说话人识别电话语音维吾尔语
结项摘要

结合维吾尔语发音特点,研究基于电话语音的维吾尔语说话人识别系统的关键技术、新思路、新方法。针对维吾尔语连续语音的多变性和复杂性带来的语言现象,以日常用语为信源,建立包括100发音人的电话通信和自由发话语音语料库,提取并分析维吾尔语电话语音特征参数,研究维吾尔语语音端点检测技术、噪音消除技术、特征提取方法,研究基于多语料、多通道参数加权识别、高斯混合分布模型以及支持向量机等技术的多层说话人识别技术。本项研究在国内外阿勒泰语系中首次研究电话语音说话人识别系统,具有一定的特殊性和创新性,弥补我国少数民族语音信息处理研究的空白,有着重大国内外影响和意义,是眼前亟待解决的重大课题。本项成果在公安、安全防御、通讯、信息检索等领域有着重大应用前途,另外这项成果还可在中亚、西亚使用阿勒泰语系国家中推广应用。为维吾尔语语音信息处理研究打下扎实的理论和实践基础。

项目摘要

结合维吾尔语发音特点,研究基于电话语音的维吾尔语说话人及语音内容识别系统的关键技术。针对维吾尔语连续语音的多变性和复杂性带来的语言现象,以日常用语为信源,建立了包括350目标发音人的电话通信和自由发话语音语料库,并且进行角色、内容和情感标注,提取并分析维吾尔语电话语音特征参数,研究维吾尔语语音端点检测技术、特征提取方法,基于GMM-UBM/SVM混合方法的说话人识别技术,研究了基于电话语音的维吾尔语连续语音识别技术。在目标人训练数据在20秒时的识别结果在采用GMM-UBM/SVM方法时,有大幅度提高,即识别率约为94%。本项研究在国内外阿勒泰语系中首次研究电话语音说话人识别系统,为我国少数民族语音信息处理研究提供了数据和技术基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

DOI:10.6041/j.issn.1000-1298.2022.07.022
发表时间:2022
2

新型树启发式搜索算法的机器人路径规划

新型树启发式搜索算法的机器人路径规划

DOI:10.3778/j.issn.1002-8331.1903-0411
发表时间:2020
3

基于自适应干扰估测器的协作机器人关节速度波动抑制方法

基于自适应干扰估测器的协作机器人关节速度波动抑制方法

DOI:10.13973/j.cnki.robot.210412
发表时间:2022
4

基于小波高阶统计量的数字图像来源取证方法

基于小波高阶统计量的数字图像来源取证方法

DOI:
发表时间:2017
5

老年2型糖尿病合并胃轻瘫患者的肠道菌群分析

老年2型糖尿病合并胃轻瘫患者的肠道菌群分析

DOI:10.3877/cma.j.issn.1674-6880.2020.02.006
发表时间:2020

吾守尔·斯拉木的其他基金

批准号:61433012
批准年份:2014
资助金额:300.00
项目类别:重点项目
批准号:60163001
批准年份:2001
资助金额:17.00
项目类别:地区科学基金项目
批准号:61165001
批准年份:2011
资助金额:62.00
项目类别:地区科学基金项目
批准号:69363001
批准年份:1993
资助金额:6.00
项目类别:地区科学基金项目
批准号:60363004
批准年份:2003
资助金额:22.00
项目类别:地区科学基金项目
批准号:60762006
批准年份:2007
资助金额:17.00
项目类别:地区科学基金项目
批准号:U1435215
批准年份:2014
资助金额:200.00
项目类别:联合基金项目

相似国自然基金

1

基于ARVM/GMM-UBM电话语音的说话人识别研究

批准号:60272039
批准年份:2002
负责人:戴蓓倩
学科分类:F0111
资助金额:20.00
项目类别:面上项目
2

基于因子分析的会话语音说话人识别研究

批准号:11504406
批准年份:2015
负责人:杨琳
学科分类:A2305
资助金额:24.00
项目类别:青年科学基金项目
3

基于听觉感知模型的说话人识别和语音语种识别新方法研究

批准号:60572083
批准年份:2005
负责人:刘加
学科分类:F0111
资助金额:23.00
项目类别:面上项目
4

噪声和短语音条件下的说话人识别

批准号:61370034
批准年份:2013
负责人:张卫强
学科分类:F0605
资助金额:82.00
项目类别:面上项目