基于图像摘要的视频编码与检索研究

基本信息
批准号:61302111
项目类别:青年科学基金项目
资助金额:26.00
负责人:王啟军
学科分类:
依托单位:中国电子科技集团公司第三十八研究所
批准年份:2013
结题年份:2016
起止时间:2014-01-01 - 2016-12-31
项目状态: 已结题
项目参与者:甘彤,朱明清,姜少波,凌虎,李姗琦
关键词:
虚拟帧图像摘要视频编码视频检索KL变换
结项摘要

Higher coding performance and retrieval-friendly features are required in future video applications, and then this project focuses on video coding and retrieval based on image epitome. Firstly, following the research of intra coding and refresh with video epitomic priors, K-L transformation is constructed for intra coding with image epitome, with the purpose of covering the prediction error distribution after intra prediction better, from the perspective of the whole of the combination of transformation and prediction, while the coding gain of 0.3dB is expected. Secondly, we formulate the inter-frame prediction via virtual reference frame, which is constructed by fusing multple reference frames through video epitomic analysis, changing the current reference management strategy, and this work will solve the contradiction between the number of reference frames and the covering video content, and can improve the coding efficiency by 0.5dB comparing with video codec with two reference frames, and have the same coding performance with video codec with multiple reference frames. At last, the key frame for video retrieval can be extracted based on given video epitomic priors for prediction in the bitstream, taking advantage of coving more content for image epitome. The retrieval features are also evaluated for the novel key-frame extraction method in this work. Comparing with the video retrieval system with conventional key-frame extraction method, an improvement on precision and recall by 10% is expected.

针对未来视频应用对编码效率和检索友好性的需求,本项目研究基于图像摘要的视频编码与检索。首先,在基于图像摘要先验知识的帧内编码与刷新的研究基础上,进一步优化基于图像摘要帧内预测的编码方式,从预测和变换的整体出发,构建与图像摘要帧内预测残差分布相适应的K-L变换,预期能够进一步提高帧内编码的编码效率0.3dB以上;第二,使用图像摘要生成方式重新构建多帧预测中的参考帧管理策略,形成基于图像摘要的虚拟帧帧间预测技术,减少参考帧缓存开销,解决参考帧数量和所覆盖图像内容范围之间的矛盾,与具有两个参考帧的编码方法相比,预期提升编码效率0.5dB以上,并与多帧预测编码性能相当;最后,研究基于图像摘要的关键帧提取及其在视频检索中的应用,利用在码流中已经存在的图像摘要先验知识,提取视频镜头的关键帧,确定与之适应的最佳检索特征,与传统的基于关键帧的像素域视频检索方法相比,预期提升查准率和查全率10%以上。

项目摘要

在项目执行期间,项目团队严格执行研究计划的各项任务安排,分别研究了面向图像摘要帧内预测的KLT变换、基于图像摘要的虚拟帧帧间预测、基于图像摘要的压缩域像素域混合视频检索等三项主要研究内容。在研究过程中,项目团队通过实验发现项目申请书中的一些路线、方法存在一些问题或者不足之处,并根据研究结果灵活调整了研究策略和相应的技术路线,并取得了较好的研究结果,本项目的研究内容主要包括:在面向图像摘要帧内预测的KLT变换基础之上,推导得出视频编码中整数正弦变换的所有变换核,得到一组比HEVC(High Efficiency Video Coding)标准中所采用的整数正弦变换更优的变换核,相对于HEVC,编码增益达到0.3dB;研究了基于纹理合成和视觉显著度的视频编码方法,与H.264/AVC编码方法相比,在相同主观质量的情况下,能够降低码率5%到20%;根据公安刑侦实战的需要,开发了商用的基于SIFT特征和颜色特征的“以图搜图”图像检索系统和视频侦查作战系统,并在全国数十家地市公安局部署使用,有力地提升了民警的办案能力,产生了良好的经济效益和社会效益。在项目资助期间,项目团队在国内外重要的学术期刊和会议上发表高质量的学术论文6篇;申报专利4项,取得专利授权3项;申报软件著作权2项;基于本项目相关技术的“博微视频侦查系统V1.0”通过同行专家鉴定,被安徽省科技厅授予省级科技成果;主持制定企业生产标准1项;

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

Protective effect of Schisandra chinensis lignans on hypoxia-induced PC12 cells and signal transduction

Protective effect of Schisandra chinensis lignans on hypoxia-induced PC12 cells and signal transduction

DOI:10.1080/15287394.2018.1502561
发表时间:2018
2

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究

Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究

DOI:
发表时间:2020
5

当归红芪超滤物对阿霉素致心力衰竭大鼠炎症因子及PI3K、Akt蛋白的影响

当归红芪超滤物对阿霉素致心力衰竭大鼠炎症因子及PI3K、Akt蛋白的影响

DOI:10.3969/j.issn.1008-0805.2022.07.18
发表时间:2022

王啟军的其他基金

相似国自然基金

1

视频序列的摘要与检索

批准号:60302017
批准年份:2003
负责人:刘明刚
学科分类:F0113
资助金额:6.00
项目类别:青年科学基金项目
2

图像与视频中基于人脸的内容标注与检索

批准号:60673107
批准年份:2006
负责人:艾海舟
学科分类:F0605
资助金额:25.00
项目类别:面上项目
3

基于内容的图像视频检索的理论和算法研究

批准号:60372012
批准年份:2003
负责人:黄廷祝
学科分类:F0113
资助金额:7.00
项目类别:面上项目
4

基于稀疏建模的视频图像编码与重建方法研究

批准号:61370114
批准年份:2013
负责人:熊瑞勤
学科分类:F0210
资助金额:80.00
项目类别:面上项目