基于压缩感知的语音信号建模与编码技术研究

基本信息
批准号:61072125
项目类别:面上项目
资助金额:30.00
负责人:陈砚圃
学科分类:
依托单位:中国人民解放军国防科技大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:程荣贵,高悦,闵刚,杜佳,谭薇,刘锐鹏,贺少华,杨森斌
关键词:
语音编码语音建模L1优化压缩感知
结项摘要

随着编码速率的降低,传统的语音编码模型和方法难以实现高质量语音编码。压缩感知(Compressed Sensing,CS)理论与奈奎斯特采样定理不同,具有直接信息采样特征,是对传统信号采样方法的一次新的革命,基于CS的语音信号描述和处理框架为语音编码技术研究提供了全新的思路和方法。本项目将CS理论和传统的语音编码技术相结合,研究语音信号的CS性能、基于CS的语音信号建模方法和编码技术,解决语音信号及其编码参数的稀疏变换、CS观测矩阵的构造与实现、超低速率条件下语音编码参数的高效量化、CS框架下语音信号的高质量L1优化重构等问题。在此基础上,建立一套新的语音编码方案,实现高质量中速率、低速率和超低速率语音编码,支持的编码速率从32kbps到300bps。本项目是对逼近语音编码速率极限研究的有意义探索,研究成果可用于军用短波、超短波、卫星通信等领域,具有重要的理论研究意义、军事意义和实用价值。

项目摘要

压缩感知具有高效的信息处理能力,借助其实现语音压缩编码就成为了一种新方法的探索。为使压缩感知与语音信号更好地结合发挥其在压缩编码上的优势,项目主要从三个大的方面展开研究工作:1、语音稀疏表示方法研究。主要研究了稀疏性度量指标、语音稀疏化途径及相应的几种稀疏表示手段。研究发现语音信号可以进行稀疏表示,具备利用压缩感知进行处理的条件,同时,受稀疏表示手段等诸多因素的影响,实际效果不尽相同,目前的语音稀疏化水平还有待进一步提升。2、压缩感知处理语音的模型研究。主要围绕对语音信号的观测和重构问题结合非均匀采样理论提出了一种非均匀观测方法,并有针对性地给出了一种重构流程。在此基础上,还论证了非均匀采样与压缩感知之间的异同,通过实验数据分析认为非均匀采样与压缩感知在语音信号信息获取能力上效果相当,而且非均匀采样在实用性方面更具有优势。此外,还针对语音传输和存储两种应用背景分别提出了语音压缩感知框架。3、压缩感知在语音编码中的应用研究。围绕如何降低编码速率的问题,从语音观测数据的高效量化编码出发,分别利用标量量化和分裂矢量量化方法进行编码,结果表明矢量量化方法要明显优于标量量化方法,在16kbps的中速率语音编码上基本可用,但语音质量并不是很好。为进一步降低编码速率,构建了语音编码参数的压缩感知方法,结合相关参数编码技术在低速率和极低速率语音编码上进行了仿真实验,结果表明低编码速率下语音质量较差,仅可作为语音编码的一种方法,而不足以取代现有编码技术。在以上研究工作的基础上,最后总结了研究中的一些经验,并指出了存在的问题,在此基础上,指出了还有待更深入进行研究的几个问题及对应思路。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
3

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019
4

基于混合优化方法的大口径主镜设计

基于混合优化方法的大口径主镜设计

DOI:10.3788/AOS202040.2212001
发表时间:2020
5

变可信度近似模型及其在复杂装备优化设计中的应用研究进展

变可信度近似模型及其在复杂装备优化设计中的应用研究进展

DOI:10.3901/jme.2020.24.219
发表时间:2020

陈砚圃的其他基金

相似国自然基金

1

基于Lp优化的语音压缩感知理论和编码技术的研究

批准号:60971129
批准年份:2009
负责人:杨震
学科分类:F0111
资助金额:30.00
项目类别:面上项目
2

基于压缩感知的WMSN编码传输与视频重构技术研究

批准号:61801431
批准年份:2018
负责人:张美燕
学科分类:F0104
资助金额:25.00
项目类别:青年科学基金项目
3

基于特征加密的抗压缩编码语音加密技术研究

批准号:61302107
批准年份:2013
负责人:丁琦
学科分类:F0108
资助金额:26.00
项目类别:青年科学基金项目
4

基于对称锥规划的压缩感知信号重建模型与算法研究

批准号:11601406
批准年份:2016
负责人:李远敏
学科分类:A0405
资助金额:18.00
项目类别:青年科学基金项目