融合视觉感知特性的低复杂度视频编码关键技术研究

基本信息
批准号:61602383
项目类别:青年科学基金项目
资助金额:20.00
负责人:周欣
学科分类:
依托单位:西北工业大学
批准年份:2016
结题年份:2019
起止时间:2017-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:周巍,魏恒璐,连晓聪,杨佳敏,阎诗晨
关键词:
感知视频编码模式选择率失真优化视频压缩
结项摘要

The latest High Efficiency Video Coding (HEVC) standard significantly increases the computation complexity for improving its coding efficiency. Since it is limited by the conventional block-based hybrid coding framework, the visual redundancy could not be removed effectively. So there should also be some room for the improvement of video encoding efficiency. Based on the characteristics of human visual perception, this project will do research on the perceptual rate-distortion optimization and low-complexity mode selection algorithm in HEVC. First, a stair quality level plot function will be modeled by machine learning algorithm which is trained using the data obtained by subjective tests and JND masking effect. This stair quality level plot model will indicate the stair-wise relationship between the subjective perceptual quality and the quantization parameter. Meanwhile, a block-based spatio-temporal visual saliency model will be built by fusing the visual features of video sequences in spatial domain and temporal domain. The block-based spatio-temporal visual saliency model will represent the region and degree of human visual attention in the video sequences. Second, the visual perception characteristics in stair quality level plot model and block-based spatio-temporal visual saliency model will be combined to develop the perceptual rate-distortion optimization method of HEVC, which utilizes the perceived video distortion as the distortion metric. Then fast mode selection algorithm for HEVC will be proposed using the new perceptual rate-distortion optimization method and the visual perception characteristics. Finally, the low-complexity perceptual video coding scheme of HEVC will be realized. The corresponding outcome is expected to provide theoretical and technology basis for the spread and application of HEVC and perceptual video coding.

新一代视频编码标准HEVC在提高编码性能的同时大幅增加了计算复杂度,且受限于传统的混合编码框架,并不能有效去除视觉冗余,因此编码效率仍具有提升空间。本项目将通过融合视觉感知特性,研究HEVC感知率失真优化与低复杂度模式选择算法。首先,利用主观质量测试与JND掩盖效应,运用机器学习算法建立阶梯式主观质量层次模型,揭示主观感知质量与编码量化参数之间的阶梯关系;同时,通过融合视频序列在空间域和时间域的视觉特征,建立基于区域块的时空域视觉显著性模型,反映人眼对视频序列的关注区域及关注程度。然后,通过融合上述阶梯式主观质量层次模型和时空域视觉显著性模型的视觉感知特性,以主观感知失真作为失真度量,实现HEVC感知率失真优化方法,进而降低HEVC编码模式选择的运算复杂度。最终实现融合视觉感知特性的低复杂度HEVC感知视频编码算法,为促进HEVC和感知视频编码的推广和应用提供理论和技术基础。

项目摘要

本课题从人类视觉特性出发,主要研究基于主观视觉感知模型的HEVC感知视频编码算法。主观视觉感知模型核心内容是主观视觉信息的有效表示问题,而视频编码的根本目标则是要使用尽可能少的编码比特来表达原始视频中包含的视觉信息。因此可利用主观感知模型进行高效的编码,为突破现有编码技术框架提供新思路。第一阶段,本项目通过提取视频的空域高斯模型和时域运动矢量特征分别建立显著图,并采用基于竞争的方法进行融合形成适用于HEVC编码的压缩域视觉显著性模型。实验结果表明所提出显著性模型的KL散度、ROC曲线以及AUC曲线优于经典方法,且平均检测速度较快。本项目还利用HEVC编码视频的主观测试实验、JND掩盖效应和机器学习等方法,建立了一种符合视频编码特性的阶梯式主观质量层次模型,从而揭示编码视频序列主观感知质量与量化参数之间的阶梯式函数关系。实验结果平均误差小于0.07。第二阶段,本项目利用了视觉显著性模型建立当前区域块的显著性与对应编码单元划分深度的映射关系,同时采用掩盖效应因子对编码单元的划分深度范围进行调节;然后使用融合视觉感知特性的率失真优化方法实现HEVC编码单元划分深度的选择以及视频帧量化参数的调节,在提高编码效率的同时降低HEVC编码模式选择的计算复杂度。实验结果表明此类算法能在保证视频质量的前提下减少10%以上的码率;或减少50%以上的计算复杂度而造成较少比特率的增加。另一方面,为了解决当前码率控制算法所产生的视频质量分布与人眼感知不匹配的问题,研究基于视觉显著性的码率控制算法,根据人眼对视频内容的感兴趣程度分配码率,从而增强感兴趣区域的质量。本项目使用拉格朗日乘子法求解该优化问题。实验结果表明所提出的码率控制算法使得帧的显著性加权PSNR提升1dB以上。本项目的相关研究成果可以用于常规的高清视频编码工作中,更可以在对于编码复杂度或主观质量有限制的场合更好地发挥优势。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
2

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像

DOI:10.11999/JEIT150995
发表时间:2016
3

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

宁南山区植被恢复模式对土壤主要酶活性、微生物多样性及土壤养分的影响

DOI:10.7606/j.issn.1000-7601.2022.03.25
发表时间:2022
4

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
5

坚果破壳取仁与包装生产线控制系统设计

坚果破壳取仁与包装生产线控制系统设计

DOI:10.19554/j.cnki.1001-3563.2018.21.004
发表时间:2018

周欣的其他基金

批准号:21303030
批准年份:2013
资助金额:25.00
项目类别:青年科学基金项目
批准号:81101990
批准年份:2011
资助金额:23.00
项目类别:青年科学基金项目
批准号:31772493
批准年份:2017
资助金额:63.00
项目类别:面上项目
批准号:21871066
批准年份:2018
资助金额:65.00
项目类别:面上项目
批准号:81570335
批准年份:2015
资助金额:57.00
项目类别:面上项目
批准号:31171190
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:81860738
批准年份:2018
资助金额:38.00
项目类别:地区科学基金项目
批准号:41905037
批准年份:2019
资助金额:25.00
项目类别:青年科学基金项目
批准号:11004228
批准年份:2010
资助金额:23.00
项目类别:青年科学基金项目
批准号:51708105
批准年份:2017
资助金额:22.00
项目类别:青年科学基金项目
批准号:30760293
批准年份:2007
资助金额:18.00
项目类别:地区科学基金项目
批准号:30740010
批准年份:2007
资助金额:10.00
项目类别:专项基金项目
批准号:31570358
批准年份:2015
资助金额:63.00
项目类别:面上项目
批准号:91859206
批准年份:2018
资助金额:310.00
项目类别:重大研究计划
批准号:81070121
批准年份:2010
资助金额:32.00
项目类别:面上项目
批准号:81060340
批准年份:2010
资助金额:27.00
项目类别:地区科学基金项目
批准号:81702290
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:21808066
批准年份:2018
资助金额:28.00
项目类别:青年科学基金项目

相似国自然基金

1

基于视觉感知模型的视频编码关键技术研究

批准号:61573037
批准年份:2015
负责人:徐迈
学科分类:F0609
资助金额:66.00
项目类别:面上项目
2

基于视觉特性的视觉感知分析与视频编码优化

批准号:61771348
批准年份:2017
负责人:陈震中
学科分类:F0108
资助金额:67.00
项目类别:面上项目
3

低功耗低复杂度视频编码理论与关键算法研究

批准号:61103124
批准年份:2011
负责人:姜东
学科分类:F0209
资助金额:24.00
项目类别:青年科学基金项目
4

面向下一代视频编码标准的低复杂度编码方法关键技术研究

批准号:61100131
批准年份:2011
负责人:刘鹏宇
学科分类:F0210
资助金额:21.00
项目类别:青年科学基金项目