适于含噪语音信号过程的随机过程叠加与声学语音特征研究

基本信息
批准号:10971253
项目类别:面上项目
资助金额:25.00
负责人:陈金文
学科分类:
依托单位:清华大学
批准年份:2009
结题年份:2012
起止时间:2010-01-01 - 2012-12-31
项目状态: 已结题
项目参与者:葛余博,刘智新,邓晓雪,葛菱南,简思綦,刘进,易培,徐晓华
关键词:
动态指标声学特征含噪语音信号过程随机模型算法随机过程叠加
结项摘要

语音信号过程是一个复杂随机过程,其间涉及多个平稳和不平稳过程的交替和叠加,不同实生活噪声环境下的语音听觉感知更是个复杂随机过程。至今国内外还没有对适合语音信号过程的这类复杂随机过程的认真研究,而自动语音识别现在面临的进展缓慢的尴尬局面正源于此。本课题旨在拓展并深化随机过程和语音识别的研究成果,进行这类过程的研究,包括大偏差、多元统计分析及随机调和分析等在内的各种现代概率统计理论和技术的研究。从出现在声韵之间和声噪之间"音征互载"的随机数学模型和特征研究入手,挖掘新信息新特征,并提取、整合与分类,构建一批新特征组;探索语音过程的动态指标(包括非平稳性测度和聚集度等),用以实现自组织能力,去自动选择过程模型和参数特征以适应含噪的语音识别。从而改变现有识别理论与系统采用统一参数模式和识别模型的现状,改变淹没语音'个性'的弊端。本项目研究是语音识别理论和系统的创新,达到和超过国际先进水平。

项目摘要

本项目主要基于随机过程理论和方法研究声学语音过程中的基本特征提取等问题。我们的基本出发点是认为声学语音过程是若干个随机过程的混合,包括隐Markov过程、平稳与非平稳过程的迭加等。我们利用随机过程和统计学的有关理论方法,包括大偏差、多元统计分析和随机调和分析等,对声学语音过程的特征进行了深入的分析和模拟,得到了一些较深刻的理论结果,在语音信号过程的建模、识别方法和算法方面也有若干实质性改进。我们的研究中包含了若干原创性的问题和研究方法,为更一般的声学研究及广泛的非线性信号处理打下了良好的基础。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

陈金文的其他基金

批准号:11671226
批准年份:2016
资助金额:48.00
项目类别:面上项目
批准号:10371063
批准年份:2003
资助金额:15.00
项目类别:面上项目
批准号:11271220
批准年份:2012
资助金额:50.00
项目类别:面上项目

相似国自然基金

1

适于汉语特征的多导电子耳蜗语音信号处理方法的研究

批准号:30000041
批准年份:2000
负责人:聂开宝
学科分类:C1003
资助金额:16.00
项目类别:青年科学基金项目
2

适于语音和话者识别的新随机模型、参数和算法研究

批准号:19871045
批准年份:1998
负责人:葛余博
学科分类:A0403
资助金额:8.50
项目类别:面上项目
3

汉语连续语音识别的声学语音学模型研究

批准号:69672010
批准年份:1996
负责人:富煜清
学科分类:F0111
资助金额:8.00
项目类别:面上项目
4

基于频率弯折小波和DZCPA特征的抗噪语音识别

批准号:60472094
批准年份:2004
负责人:张雪英
学科分类:F0111
资助金额:18.00
项目类别:面上项目