语音信号过程是一个复杂随机过程,其间涉及多个平稳和不平稳过程的交替和叠加,不同实生活噪声环境下的语音听觉感知更是个复杂随机过程。至今国内外还没有对适合语音信号过程的这类复杂随机过程的认真研究,而自动语音识别现在面临的进展缓慢的尴尬局面正源于此。本课题旨在拓展并深化随机过程和语音识别的研究成果,进行这类过程的研究,包括大偏差、多元统计分析及随机调和分析等在内的各种现代概率统计理论和技术的研究。从出现在声韵之间和声噪之间"音征互载"的随机数学模型和特征研究入手,挖掘新信息新特征,并提取、整合与分类,构建一批新特征组;探索语音过程的动态指标(包括非平稳性测度和聚集度等),用以实现自组织能力,去自动选择过程模型和参数特征以适应含噪的语音识别。从而改变现有识别理论与系统采用统一参数模式和识别模型的现状,改变淹没语音'个性'的弊端。本项目研究是语音识别理论和系统的创新,达到和超过国际先进水平。
本项目主要基于随机过程理论和方法研究声学语音过程中的基本特征提取等问题。我们的基本出发点是认为声学语音过程是若干个随机过程的混合,包括隐Markov过程、平稳与非平稳过程的迭加等。我们利用随机过程和统计学的有关理论方法,包括大偏差、多元统计分析和随机调和分析等,对声学语音过程的特征进行了深入的分析和模拟,得到了一些较深刻的理论结果,在语音信号过程的建模、识别方法和算法方面也有若干实质性改进。我们的研究中包含了若干原创性的问题和研究方法,为更一般的声学研究及广泛的非线性信号处理打下了良好的基础。
{{i.achievement_title}}
数据更新时间:2023-05-31
涡度相关技术及其在陆地生态系统通量研究中的应用
粗颗粒土的静止土压力系数非线性分析与计算方法
内点最大化与冗余点控制的小型无人机遥感图像配准
中国参与全球价值链的环境效应分析
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
适于汉语特征的多导电子耳蜗语音信号处理方法的研究
适于语音和话者识别的新随机模型、参数和算法研究
汉语连续语音识别的声学语音学模型研究
基于频率弯折小波和DZCPA特征的抗噪语音识别