With the rapid development of network, computer and display techniques, large numbers of videos are generated using digital devices. These screen video are typically consisted of various contents and have high resolution. Existing video coding standards cannot compress screen videos efficiently and new methods and theories are needed. In this project, we study the methods for efficient coding of screen contents. A representation scheme in spatial is proposed, which breaks the framework of existing video coding standards. A 2D dictionary based video coding method is proposed to exploit the repeated patterns in screen content. We also design a motion estimation method, which supports large motions. Finally, the rate-distortion optimization is adopted to combine all the methods together. This project will help the development of researches on video coding in china and contributes to the next generation video coding standards.
随着网络、通讯、计算机和显示等技术的快速发展和智能手机与平板电脑的广泛应用,大量的高清视频直接用电子设备获取和生成。这类计算机生成的屏幕视频具有分辨率高、内容多样和重复模式多和运动范围大的特点。 已有的视频编码标准无法高效压缩屏幕视频, 因此实现屏幕视频的高效压缩需要新的思路和新的方法。本项目从探索面向屏幕内容的视频编码算法入手,突破目前已有的视频编码标准的混合视频编码框架,研究屏幕内容的空域表示方法,根据屏幕内容具有大量重复模式的特性,提出基于二维字典的编码方法,设计支持大范围运动的运动估计算法,通过码率失真最优化将多种算法和HEVC的编码框架结合,从而构建高效的面向屏幕视频的编码方案。 本课题的研究可以进一步推动我国视频编码研究的发展,为我国下一代视频编码标准作出贡献。
计算机生成的屏幕视频具有分辨率高和内容多样的特点。这类屏幕视频的典型内容包括幻灯片播放、文本编辑、动画、游戏、网页浏览。屏幕视频的高效压缩成为了无限显示、云桌面、电子白板等新一代多媒体应用的核心技术.目前主流的视频压缩编准MPEG, MPEG2, H.264/AVC, HEVC/H.265均针对自然视频的高效压缩而设计。但屏幕视频和传统的视频在帧内相关性、帧间的运动和视频的噪声等方面都有着很大的差异。本课题针对计算机生成的屏幕视频的高效编码展开研究,打破了已有的视频编码的预测变换框架,研究针对屏幕视频的表示、模型、预测和运动估计方法展开。在算法方面,提出了基于哈希的屏幕内容块匹配、基于HEVC的动态背景建模、基于内容的自适应插值滤波器。在模型方面,提出了多维稀疏表示模型的字典训练算法、基于二维非局部稀疏表示模型。在视频编码快速算法方面,提出了多层哈希运动估计、快速亚像素运动估计算法和HEVC分数像素快速搜索算法。这些算法有效的提高了屏幕视频的编码效率。
{{i.achievement_title}}
数据更新时间:2023-05-31
拥堵路网交通流均衡分配模型
采用深度学习的铣刀磨损状态预测模型
下调SNHG16对胃癌细胞HGC-27细胞周期的影响
基于EM算法的混合t-分布模型参数估计
BDS-2/BDS-3实时卫星钟差的性能分析
HEVC标准框架下面向复合内容的屏幕视频编码
基于主观质量评价模型的屏幕视频高效编码研究
面向无线视频通信的视频软编码技术研究
面向视频直播的编码优化技术研究