视频编码技术是多媒体信息处理领域的重要分支,在国防、医疗、教育、传媒等相关信息产业具有广泛的应用前景,其发展潜力依赖于快速视频编码技术的新进展。本课题针对国际视频编码联合小组JCT-VC最新提出的下一代视频编码标准HEVC的制定目标,围绕低复杂度、高效率的视频编码关键技术展开研究,旨在面向HEVC的关键理论与编码技术取得创新性研究成果。首先,将机器学习方法引入到视频编码中,实现基于支持向量机的预测模式快速决策,为提高视频编码实时性和鲁棒性带来良好契机;其次,利用视觉感知特征,探索视频图像质量评价准则和高效编码的解决途径,使编码框架在高质量与低复杂度方面达到平衡;最后,定义新的预测模式类型,将运动估计的块匹配思想引入到帧内预测编码中,力争突破现有视频编码标准的编码局限。本课题对下一代高效视频编码理论与方法体系的建立以及我国AVS的发展与应用具有重要的理论意义与研究价值。
本项目面向下一代视频编码标准HEVC的制定目标,旨在建立低复杂度、高效率的视频编码框架。首先,结合认知神经科学感知原理和人工智能处理的方法,以已编码视频码流中编码信息与编码模式间有着较强相关性为依据,提出了基于支持向量机的编码模式快速决策机制,包括基于聚类的快速SVM训练算法和基于二分类SVM的分层式分配器结构设计,将模式选择问题转化为模式分类问题,克服现有方法依赖于经验阈值进行模式判决带来的预测准确度低的缺陷,降低了53%的预测模式选择编码运算量,实现了低复杂度的预测模式选择。之后,针对HEVC标准忽略人类视觉系统HVS的视觉感知差异性这一问题,提出了基于HVS的HEVC快速视频编码方案,构建了可分级的视频编码框架,将视觉感知分析层和快速视频编码层集成在一个编码框架中,实现信息共享和协同工作,利用码流信息实现低复杂度的视觉感知特征分析,再利用特征分析结果指导编码方案的选择,使编码框架在准确性、复杂性等方面达到平衡。同时,探索了面向HEVC的视频编码新思想,针对I帧编码高比特占有率的问题,基于信息熵理论,提出了基于帧差图像的低码率帧内预测编码技术,并设计了帧差图像编码器DI,与HM(10.0)相比较,在同等重建图像质量下节省了16.1%的码率;针对P/B帧编码中固有的由于量化失真所导致的编码资源耗费问题,提出了基于帧间纹理相关性的残差图像预测编码策略,并设计了残差图像编码器RI,进一步提高了HEVC压缩比;结合上述两项编码新技术,基于率失真路径规划构建了融合多编码器(DI/HEVC/RI)的高性能视频编码框架,拓展了HEVC的压缩性能,与单一的HEVC编码器(HM15.0)相比较,平均降低15.26%的码率,或提高0.91dB的PSNR,实现了高效编码。. 本项目着眼于低复杂度、高效率的HEVC视频编码新技术,提出了具有可行性的视频编码方案,取得了一系列具有自主知识产权的研究成果,为下一代高效视频编码理论与方法体系的建立以及我国AVS的发展与应用,提供了技术支持。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
基于LASSO-SVMR模型城市生活需水量的预测
基于SSVEP 直接脑控机器人方向和速度研究
基于多模态信息特征融合的犯罪预测算法研究
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于内容分析的低复杂度高效视频编码方法
面向下一代视频编码标准的高效算法研究
融合视觉感知特性的低复杂度视频编码关键技术研究
面向新一代可伸缩视频编码标准SHVC标准的关键技术研究