语言识别是计算机通过分析处理一个语音片段以判别其属于何语种的过程。随信息技术的快速发展,基于电话的多民族语信息查询系统、民族语口语翻译系统的需求有快速增长的趋势,而民族语言识别是这些系统不可缺少的组成部分。到目前为止,国内外的语言识别研究基本围绕两个较通用的语音数据库中所包含的十几种语言进行,几乎不涉及其它语言。在我国少数民族语中,大量地、随意地使用汉语借词,因此,中国少数民族语的语言识别区别于典型的语言识别,同时兼有语言识别和口音识别,此类研究尚未见报道。本项目选择9个具有代表性的少数民族语及汉语普通话,构建民族语电话语音库。基于未进行语音学标记的语音数据库,研究民族语识别方法,设计实现训练算法和识别算法。研究多分类器选择和融合问题,最后提出一种新的能包容汉语借词并易于扩张到其它少数民族语的语言识别方法。本项目将有力促进语言识别研究,推动现代信息技术为广大边疆少数民族同胞服务。
{{i.achievement_title}}
数据更新时间:2023-05-31
居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例
基于细粒度词表示的命名实体识别研究
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
适用于带中段并联电抗器的电缆线路的参数识别纵联保护新原理
基于Pickering 乳液的分子印迹技术
多少数民族语言连续语音识别方法及应用
基于电话语音的维吾尔语说话人识别研究
基于ARVM/GMM-UBM电话语音的说话人识别研究
濒危少数民族语言语音声学数据库及声学分析