基于机器学习和优化建模的视频大数据感知编码研究

基本信息

批准号：61801303

项目类别：青年科学基金项目

资助金额：26.00

负责人：高伟

学科分类：

依托单位：北京大学深圳研究生院

批准年份：2018

结题年份：2021

起止时间：2019-01-01 - 2021-12-31

项目状态：已结题

项目参与者：张小燕,邹龙昊,秦红莲,敖威,刘伟光,许书华

关键词：

高效视频编码码率控制与资源分配机器学习与优化模型视觉感知建模感知率失真优化

结项摘要

The popularization of multimedia applications makes the explosive increase of video data, which significantly puts a considerable burden on video transmission and storage. Therefore, it has become a key and difficult problem to be urgently solved to explore more efficient coding strategies for big video data. Traditional coding methods usually neglect the measurement and optimization of subjective quality of visual experience, and thus the visual redundancy has not been fully exploited. Moreover, existing perceptual models are not devised for video coding applications, hence the change of perceived quality cannot be accurately evaluated due to compression. In addition, the parameters in traditional optimization models cannot be accurately obtained, which degrade the optimization results. This project will focus on using visual perception, optimization model and machine learning to improve the video coding efficiency. Firstly, by building the database for perceptual quality evaluation with consideration of the video coding applications, we propose to devise the models of various perceptual factors, then the models for rate-distortion optimization with the joint perceptual effects. Afterwards, we propose to use game theory to model the bandwidth resource allocation problem to optimize the visual comfort. Finally, we will also investigate how to use extreme learning machine (ELM) to improve the modeling for perceptual factors and joint rate-distortion optimization, and how to use doubly sparse relevance vector machine (DSRVM) to improve the model prediction accuracy problem in video coding, etc. This project will achieve the theoretical innovations and technical breakthroughs on perceptual coding of big video data, which will essentially promote the developments of video applications.

多媒体应用的普及使得视频数据呈现爆发式的增长，增加了视频传输与存储的负担，因此探索更有效的视频大数据编码方法成为急需解决的关键和难点问题。传统编码方法忽略了主观视觉体验质量的度量和优化，导致视觉冗余信息尚未被充分利用，而已有的感知模型并未面向视频编码应用而设计，无法准确度量压缩造成的感知质量变化。此外，传统编码优化模型中无法准确获取的参数，降低了优化效果。本项目拟从视觉感知、优化模型和机器学习角度来提升编码效率。首先，搭建面向视频编码应用的感知质量数据库，再对诸多视觉感知因素建模，搭建联合感知效应的率失真优化模型；然后，基于博弈理论来优化带宽资源分配以改善视觉体验；此外，本项目还将讨论探索基于极限学习机改善视觉感知因素分析与联合率失真优化模型，以及基于双稀疏相关向量机改善视频编码中模型预测问题等。本项目可实现视频大数据感知编码与优化的理论创新和技术突破，促进大数据时代下的视频应用的发展。

项目摘要

项目背景：视频大数据的发展给存储和传输带来了极大的挑战，因此数据驱动的感知视频编码优化算法的研究具有重要的意义，可以有效提升率失真性能，改善人眼感知体验质量。大数据时代让数据的采集更加容易，有助于视频主观质量标注，另外机器学习和深度学习的发展使得模型准确度有了更好的保证，有助于率失真优化模型的搭建和调优。..主要研究内容、重要结果、关键数据：（1）研究了基于机器学习的编码参数判定方法，改善视频编码码率控制算法的率失真性能和帧级别质量平滑度性能，可以节省15.48%的码率或者降低37.2%的帧级PSNR质量波动方差；（2）面向最新一代AVS3视频编码标准，研究了硬件友好的低复杂度帧内预测和变换算法，可以有效支持在较低FPGA资源开销下的8K/60fps实时处理；（3）研究了一种可以应用于RGB-D和RGB-T视觉显著性图像检测的统一的跨模态信息融合网络，采用类似色彩信号在人脑视觉中的生成机理，取得了最佳的准确度；（4）研究了一种面向光场合成加速的算法，有效采用了分辨率缩放和网络轻量化技术，实现在较低质量损失下的视点合成加速；（5）研究了一种基于深度字典编码网络的利用高阶统计特性的盲图像评价方法以及两种面向双目图像对质量评价的算法，均获得了较好的预测性能；（6）提出了一种利用会议视频特点的帧间编码快速算法，实现对于不同编码复杂度的编码块区域使用不同计算量的分配，以在取得最多的编码时间节省的条件下获得良好的率失真性能的保持；此外，我们还围绕视频编码、图像复原、质量评价、视觉显著性检测等方面展开了一系列工作。..科学意义：本项目围绕基于视觉感知的视频编码技术展开了相关研究工作，特别是在视频编码优化中的感知质量评价、感知编码优化技术和编码实时加速等方面取得了丰硕的研究成果，促进了该领域的技术发展。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.13836/j.jjau.2020047

发表时间：2020

DOI：10.16517/j.cnki.cn12-1034/f.2015.03.030

发表时间：2015

DOI：10.16285/j.rsm.2019.1280

发表时间：2019

DOI：10.18402/resci.2020.12.01

发表时间：2020

DOI：

发表时间：2018

高伟的其他基金

批准号：31070651

批准年份：2010

资助金额：35.00

项目类别：面上项目

批准号：31100423

批准年份：2011

资助金额：20.00

项目类别：青年科学基金项目

批准号：81700331

批准年份：2017

资助金额：20.00

项目类别：青年科学基金项目

批准号：51404209

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：30901965

批准年份：2009

资助金额：20.00

项目类别：青年科学基金项目

批准号：81402256

批准年份：2014

资助金额：23.00

项目类别：青年科学基金项目

批准号：11604262

批准年份：2016

资助金额：24.00

项目类别：青年科学基金项目

批准号：61872361

批准年份：2018

资助金额：65.00

项目类别：面上项目

批准号：41406127

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：21574052

批准年份：2015

资助金额：68.00

项目类别：面上项目

批准号：81773830

批准年份：2017

资助金额：60.00

项目类别：面上项目

批准号：51379042

批准年份：2013

资助金额：80.00

项目类别：面上项目

批准号：60604019

批准年份：2006

资助金额：24.00

项目类别：青年科学基金项目

批准号：61472419

批准年份：2014

资助金额：84.00

项目类别：面上项目

批准号：21374035

批准年份：2013

资助金额：40.00

项目类别：面上项目

批准号：61701200

批准年份：2017

资助金额：25.00

项目类别：青年科学基金项目

批准号：51878184

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：41701631

批准年份：2017

资助金额：19.00

项目类别：青年科学基金项目

批准号：21906169

批准年份：2019

资助金额：26.00

项目类别：青年科学基金项目

批准号：81500074

批准年份：2015

资助金额：18.00

项目类别：青年科学基金项目

批准号：51905506

批准年份：2019

资助金额：22.00

项目类别：青年科学基金项目

批准号：31660175

批准年份：2016

资助金额：39.00

项目类别：地区科学基金项目

批准号：51674059

批准年份：2016

资助金额：62.00

项目类别：面上项目

批准号：61202475

批准年份：2012

资助金额：25.00

项目类别：青年科学基金项目

批准号：11805234

批准年份：2018

资助金额：29.00

项目类别：青年科学基金项目

批准号：11601404

批准年份：2016

资助金额：19.00

项目类别：青年科学基金项目

批准号：71774160

批准年份：2017

资助金额：48.00

项目类别：面上项目

批准号：51708227

批准年份：2017

资助金额：21.00

项目类别：青年科学基金项目

批准号：20904013

批准年份：2009

资助金额：21.00

项目类别：青年科学基金项目

批准号：61203278

批准年份：2012

资助金额：24.00

项目类别：青年科学基金项目

批准号：41206054

批准年份：2012

资助金额：24.00

项目类别：青年科学基金项目

批准号：51508471

批准年份：2015

资助金额：20.00

项目类别：青年科学基金项目

批准号：51406023

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：71864002

批准年份：2018

资助金额：28.70

项目类别：地区科学基金项目

批准号：30970578

批准年份：2009

资助金额：8.00

项目类别：面上项目

批准号：81373906

批准年份：2013

资助金额：70.00

项目类别：面上项目

批准号：51874066

批准年份：2018

资助金额：60.00

项目类别：面上项目

相似国自然基金

基于视觉特性的视觉感知分析与视频编码优化

批准号：61771348

批准年份：2017

负责人：陈震中

学科分类：F0108

资助金额：67.00

项目类别：面上项目

面向视觉感知和移动终端的高效视频编码优化研究

批准号：61672443

批准年份：2016

负责人：邝得互

学科分类：F0210

资助金额：62.00

项目类别：面上项目

基于感知质量优化的多视点视频无线传输失真建模和资源分配

批准号：61201179

批准年份：2012

负责人：周圆

学科分类：F0108

资助金额：27.00

项目类别：青年科学基金项目

基于感知失真度量的高效视频编码率失真优化研究

批准号：61371089

批准年份：2013

负责人：万帅

学科分类：F0108

资助金额：80.00

项目类别：面上项目

基于机器学习和优化建模的视频大数据感知编码研究

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于分形L系统的水稻根系建模方法研究

农超对接模式中利益分配问题研究

粗颗粒土的静止土压力系数非线性分析与计算方法

黄河流域水资源利用时空演变特征及驱动要素

硬件木马:关键问题研究进展及新动向

高伟的其他基金

植物特有的类神经钙素B与激酶复合物（CBL1-CIPK23）的晶体结构测定及功能研究

纳米氧化铜/酚醛树脂复合体系制备及应用基础研究

RBP4诱导Th17/Treg失衡在促进2型糖尿病心肌纤维化中的作用研究

基于离散元/有限元耦合的高压辊磨粉碎仿真方法与实验研究

丹参关键酶基因SmCPS特异性功能分析及其对丹参酮类成分合成的调控

Hsa-miR-486-5p调控CXCL13在PI3K/Akt介导喉鳞癌EMT及侵袭转移中的机制研究

单颗粒稀土掺杂微纳晶体的荧光特性及调控机理研究

几何与语义相结合的复杂室内场景三维重建技术研究

微生物种群演替对胶州湾溢油的响应规律及其指示的石油降解菌群构建研究

基于非纯粹配体铁系配合物催化双烯烃高选择性聚合研究

雷公藤甲素环氧基团形成相关CYP450羟化酶基因克隆及功能研究

船用星敏感器/光纤惯性测量单元深耦合导航方法研究

水下自主潜器综合导航系统不定度规空间滤波方法研究

基于微型旋翼无人飞行器的古代建筑影像获取与三维重建方法研究

自负载自活化烯烃聚合催化剂的研究

基于核方法的阵列自适应噪声抵消技术研究

基于复杂形状离散元/有限元的砂卵地层盾构仿真方法与实验研究

开放环境下流域氮磷径流输出的驱动机制与调控

室内环境中氯化石蜡（CPs）的源解析与暴露机制研究

内皮祖细胞对肺移植缺血再灌注损伤的治疗作用

面向KDP晶体表面缺陷钝化的微乳液射流去除机理研究

纳米氧化铜基防腐型酚醛树脂类原位聚合法合成机理及应用基础研究

开敞空间天然气爆炸超压与火焰加速传播的动力学耦合机制研究

容忍泄漏公钥加密的设计及安全性证明

EAST共振磁扰动线圈作用下边界粒子再循环三维特性的研究

多维时间序列时变图模型建模和预测方法研究

产业架构视域下开放式创新嵌入模式与政策靶点选择研究：以风电产业为例

基于环境与健康关联性分析的湿热地区高密度城市老旧住区景观更新指引研究——以广州为例

钳型过渡金属配合物催化异戊二烯聚合

针对中国古代建筑的结构与图像相融合的三维重建方法研究

现代黄河三角洲钓口流路叶瓣体叠覆与演化对海底稳定性的影响机制

基于CAS的社区空间适应性生成模式研究——以重庆、成都旧城社区公共空间更新为例

粉尘爆炸火焰传播异/均相燃烧控制机理转变过程的动力学机制研究

我国城市社区业主自治的溢出效应及其形成机理研究

植物特有的类神经钙素B蛋白及相互作用激酶复合物的晶体结构测定与抗性功能关系的研究

雷公藤甲素生物合成二萜合酶基因克隆及功能研究

连通容器纳米粉尘爆炸火焰与压力耦合影响机制研究

相似国自然基金