Video service has been becoming an important part in people’s daily life and work. Evaluation, compression and optimization are the main research issues and major difficulties for the widespread use of Ultra High-definition (UHD) video technology. In conventional encoding standards, the distortion is measured by Peak Signal to Noise Ratio (PSNR), which is difficult to represent human visual perceptual characteristic, and limits the compression performance. Additionally, in order to utterly eliminate all kinds of redundancy in video, complex coding structure is utilized for compression gain, in exchange of high computational complexity. As a result, it is difficult to directly compress UHD video in real time for low-power mobile electronic devices. In this project, we will first analyze visual perceptual characteristic and summarize its key influential factors to establish perceptual characteristic evaluation model. Then, we will investigate the relationship between video encoding and visual perceptual distortion response, in order to achieve a visual perceptual distortion evaluation model. At the same time, the encoding parameter optimization and mode selection are summarized as decision-making problems. According to the pattern classification theory, we will combine the visual perception evaluation model, the Rate Distortion Optimization (RDO) model, and the decision-making problems, in order to realize a joint optimization process to reduce complexity. This project will achieve theoretical innovations and technological breakthroughs for high-efficient video coding and optimization, which can open a brand new horizon for the widespread use of UHD video.
视频已成为日常生活工作中不可或缺的一部分,然而“难度量”、“难压缩”、“难优化”是超高清视频广泛应用急需解决的关键和难点问题,也是当前国内外研究的热点。传统编码方法以峰值信噪比等为指标度量失真,难以表征人眼视觉感知特性,导致消除视觉冗余有限,限制了编码压缩效率的提升。此外,为充分消除视频信号中的各类冗余,超高清视频编码中采用复杂混合编码结构,牺牲计算复杂度换取压缩性能增益,难以直接应用于移动终端等低功耗环境。本项目将首先分析视觉感知特性及其关键影响因素,建立视觉感知特性度量模型,研究超高清视频编码系统中的编码与视觉感知失真响应的关系,建立视觉感知失真度量模型,同时将编码过程中的最佳编码参数优化与选择问题归结为模式决策问题,根据模式分类理论,结合视觉感知度量、编码率失真优化、编码模式决策等内在关联进行联合优化以降低复杂度。本项目可实现高效编码与优化的理论创新和技术突破,促进超高清视频的应用。
本项目的研究目标为超高清视频编码中的关键技术。首先,通过分析视觉感知特性及其关键影响因素,建立视觉感知特性度量模型;同时,研究超高清视频编码系统中的编码与视觉感知失真响应的关系,建立视觉感知失真度量模型。然后,将编码过程中的最佳编码参数优化与选择问题归结为模式决策问题。最后,根据模式分类理论,结合视觉感知度量、编码率失真优化、编码模式决策等内在关联进行联合优化以降低复杂度。本项目在视频编码优化方面实现了核心理论与关键方法上一定的突破,具有较高的原创性。在视频编码优化方面实现了核心理论与关键方法上一定的突破,具有较高的原创性。本项目执行期间的成果包括学术成果、人才培养、国际影响等几个方面。学术成果包括(1)学术论文55篇,其中包括国际 SCI 期刊44篇(国际权威期刊 IEEE Transactions 系列刊物37篇),国际 EI 会议11 篇(CCF推荐的 A类会议5篇);(2)申请美国发明专利6项(授权4项)。在人才培养方面,项目组负责人目前担任香港城市大学电脑科学系讲席教授。合作方负责人王旭博士晋升长聘副教授,深圳大学“荔园优青”。项目组成员朱林卫、高伟、周宇、吴梦远、贾育衡、张佳和邬文慧获得香港城市大学博士学位,并获得国内外知名大学教职或知名企业研发岗位。在国际影响方面,项目负责人邝得互目前担任IEEE Transactions on Industrial Electronics (2009-)、IEEE Transactions on Industrial Informatics (2007-)和Information Science (2011-)等国际权威期刊副编辑,担任IEEE SMC协会会务分管副主席等职务,IEEE Distinguished Lecturer。
{{i.achievement_title}}
数据更新时间:2023-05-31
监管的非对称性、盈余管理模式选择与证监会执法效率?
农超对接模式中利益分配问题研究
黄河流域水资源利用时空演变特征及驱动要素
基于 Kronecker 压缩感知的宽带 MIMO 雷达高分辨三维成像
基于SSVEP 直接脑控机器人方向和速度研究
面向视觉质量的高效立体视频编码资源分配优化研究
基于视觉特性的视觉感知分析与视频编码优化
面向视觉质量优化的深度学习视频编码
面向移动终端的视频检索与浏览