基于机器学习和优化建模的视频大数据感知编码研究

基本信息
批准号:61801303
项目类别:青年科学基金项目
资助金额:26.00
负责人:高伟
学科分类:
依托单位:北京大学深圳研究生院
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:张小燕,邹龙昊,秦红莲,敖威,刘伟光,许书华
关键词:
高效视频编码码率控制与资源分配机器学习与优化模型视觉感知建模感知率失真优化
结项摘要

The popularization of multimedia applications makes the explosive increase of video data, which significantly puts a considerable burden on video transmission and storage. Therefore, it has become a key and difficult problem to be urgently solved to explore more efficient coding strategies for big video data. Traditional coding methods usually neglect the measurement and optimization of subjective quality of visual experience, and thus the visual redundancy has not been fully exploited. Moreover, existing perceptual models are not devised for video coding applications, hence the change of perceived quality cannot be accurately evaluated due to compression. In addition, the parameters in traditional optimization models cannot be accurately obtained, which degrade the optimization results. This project will focus on using visual perception, optimization model and machine learning to improve the video coding efficiency. Firstly, by building the database for perceptual quality evaluation with consideration of the video coding applications, we propose to devise the models of various perceptual factors, then the models for rate-distortion optimization with the joint perceptual effects. Afterwards, we propose to use game theory to model the bandwidth resource allocation problem to optimize the visual comfort. Finally, we will also investigate how to use extreme learning machine (ELM) to improve the modeling for perceptual factors and joint rate-distortion optimization, and how to use doubly sparse relevance vector machine (DSRVM) to improve the model prediction accuracy problem in video coding, etc. This project will achieve the theoretical innovations and technical breakthroughs on perceptual coding of big video data, which will essentially promote the developments of video applications.

多媒体应用的普及使得视频数据呈现爆发式的增长,增加了视频传输与存储的负担,因此探索更有效的视频大数据编码方法成为急需解决的关键和难点问题。传统编码方法忽略了主观视觉体验质量的度量和优化,导致视觉冗余信息尚未被充分利用,而已有的感知模型并未面向视频编码应用而设计,无法准确度量压缩造成的感知质量变化。此外,传统编码优化模型中无法准确获取的参数,降低了优化效果。本项目拟从视觉感知、优化模型和机器学习角度来提升编码效率。首先,搭建面向视频编码应用的感知质量数据库,再对诸多视觉感知因素建模,搭建联合感知效应的率失真优化模型;然后,基于博弈理论来优化带宽资源分配以改善视觉体验;此外,本项目还将讨论探索基于极限学习机改善视觉感知因素分析与联合率失真优化模型,以及基于双稀疏相关向量机改善视频编码中模型预测问题等。本项目可实现视频大数据感知编码与优化的理论创新和技术突破,促进大数据时代下的视频应用的发展。

项目摘要

项目背景:视频大数据的发展给存储和传输带来了极大的挑战,因此数据驱动的感知视频编码优化算法的研究具有重要的意义,可以有效提升率失真性能,改善人眼感知体验质量。大数据时代让数据的采集更加容易,有助于视频主观质量标注,另外机器学习和深度学习的发展使得模型准确度有了更好的保证,有助于率失真优化模型的搭建和调优。..主要研究内容、重要结果、关键数据:(1)研究了基于机器学习的编码参数判定方法,改善视频编码码率控制算法的率失真性能和帧级别质量平滑度性能,可以节省15.48%的码率或者降低37.2%的帧级PSNR质量波动方差;(2)面向最新一代AVS3视频编码标准,研究了硬件友好的低复杂度帧内预测和变换算法,可以有效支持在较低FPGA资源开销下的8K/60fps实时处理;(3)研究了一种可以应用于RGB-D和RGB-T视觉显著性图像检测的统一的跨模态信息融合网络,采用类似色彩信号在人脑视觉中的生成机理,取得了最佳的准确度;(4)研究了一种面向光场合成加速的算法,有效采用了分辨率缩放和网络轻量化技术,实现在较低质量损失下的视点合成加速;(5)研究了一种基于深度字典编码网络的利用高阶统计特性的盲图像评价方法以及两种面向双目图像对质量评价的算法,均获得了较好的预测性能;(6)提出了一种利用会议视频特点的帧间编码快速算法,实现对于不同编码复杂度的编码块区域使用不同计算量的分配,以在取得最多的编码时间节省的条件下获得良好的率失真性能的保持;此外,我们还围绕视频编码、图像复原、质量评价、视觉显著性检测等方面展开了一系列工作。..科学意义:本项目围绕基于视觉感知的视频编码技术展开了相关研究工作,特别是在视频编码优化中的感知质量评价、感知编码优化技术和编码实时加速等方面取得了丰硕的研究成果,促进了该领域的技术发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

农超对接模式中利益分配问题研究

农超对接模式中利益分配问题研究

DOI:10.16517/j.cnki.cn12-1034/f.2015.03.030
发表时间:2015
3

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
4

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
5

硬件木马:关键问题研究进展及新动向

硬件木马:关键问题研究进展及新动向

DOI:
发表时间:2018

高伟的其他基金

批准号:31070651
批准年份:2010
资助金额:35.00
项目类别:面上项目
批准号:31100423
批准年份:2011
资助金额:20.00
项目类别:青年科学基金项目
批准号:81700331
批准年份:2017
资助金额:20.00
项目类别:青年科学基金项目
批准号:51404209
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:30901965
批准年份:2009
资助金额:20.00
项目类别:青年科学基金项目
批准号:81402256
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:11604262
批准年份:2016
资助金额:24.00
项目类别:青年科学基金项目
批准号:61872361
批准年份:2018
资助金额:65.00
项目类别:面上项目
批准号:41406127
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:21574052
批准年份:2015
资助金额:68.00
项目类别:面上项目
批准号:81773830
批准年份:2017
资助金额:60.00
项目类别:面上项目
批准号:51379042
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:60604019
批准年份:2006
资助金额:24.00
项目类别:青年科学基金项目
批准号:61472419
批准年份:2014
资助金额:84.00
项目类别:面上项目
批准号:21374035
批准年份:2013
资助金额:40.00
项目类别:面上项目
批准号:61701200
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:51878184
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:41701631
批准年份:2017
资助金额:19.00
项目类别:青年科学基金项目
批准号:21906169
批准年份:2019
资助金额:26.00
项目类别:青年科学基金项目
批准号:81500074
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:51905506
批准年份:2019
资助金额:22.00
项目类别:青年科学基金项目
批准号:31660175
批准年份:2016
资助金额:39.00
项目类别:地区科学基金项目
批准号:51674059
批准年份:2016
资助金额:62.00
项目类别:面上项目
批准号:61202475
批准年份:2012
资助金额:25.00
项目类别:青年科学基金项目
批准号:11805234
批准年份:2018
资助金额:29.00
项目类别:青年科学基金项目
批准号:11601404
批准年份:2016
资助金额:19.00
项目类别:青年科学基金项目
批准号:71774160
批准年份:2017
资助金额:48.00
项目类别:面上项目
批准号:51708227
批准年份:2017
资助金额:21.00
项目类别:青年科学基金项目
批准号:20904013
批准年份:2009
资助金额:21.00
项目类别:青年科学基金项目
批准号:61203278
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目
批准号:41206054
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目
批准号:51508471
批准年份:2015
资助金额:20.00
项目类别:青年科学基金项目
批准号:51406023
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:71864002
批准年份:2018
资助金额:28.70
项目类别:地区科学基金项目
批准号:30970578
批准年份:2009
资助金额:8.00
项目类别:面上项目
批准号:81373906
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:51874066
批准年份:2018
资助金额:60.00
项目类别:面上项目

相似国自然基金

1

基于视觉特性的视觉感知分析与视频编码优化

批准号:61771348
批准年份:2017
负责人:陈震中
学科分类:F0108
资助金额:67.00
项目类别:面上项目
2

面向视觉感知和移动终端的高效视频编码优化研究

批准号:61672443
批准年份:2016
负责人:邝得互
学科分类:F0210
资助金额:62.00
项目类别:面上项目
3

基于感知质量优化的多视点视频无线传输失真建模和资源分配

批准号:61201179
批准年份:2012
负责人:周圆
学科分类:F0108
资助金额:27.00
项目类别:青年科学基金项目
4

基于感知失真度量的高效视频编码率失真优化研究

批准号:61371089
批准年份:2013
负责人:万帅
学科分类:F0108
资助金额:80.00
项目类别:面上项目