基于时空深度表征的无监督视频显著性检测研究

基本信息
批准号:61901145
项目类别:青年科学基金项目
资助金额:26.00
负责人:周晓飞
学科分类:
依托单位:杭州电子科技大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
显著性检测 无监督框架时空信息视频图像处理深度卷积网络
结项摘要

Recently, with the deployment of machine learning, especially the deep learning technique, the performance of video saliency model has been elevated significantly. However, these models are faced with two problems, namely the inadequate representation of spatiotemporal information and the lack of training data. Thus, when dealing with such videos which are with some complex scenes including fast motion, cluttered background, non-rigid deformation and so on, the performance of these models degrades significantly. Therefore, this project proposes three novel solutions to elevate the performance of video saliency detection models. Firstly, we propose a multilevel multiplexing of the spatiotemporal information based deep representation video saliency detection model, which extracts and utilizes the temporal information and the spatial information comprehensively in the steps of feature aggregation, saliency prediction and saliency fusion. Then, we propose a strong spatiotemporal relevancy based deep representation video saliency detection model, which introduces and enhances the interframe constraints of video sequence, yielding the deep features with strong spatiotemporal relevancy. Lastly, we propose an unsupervised generic video saliency detection framework, which first generates the pseudo label via the propagation of similar images and the fusion of multiple saliency maps, and then promotes the performance of the model iteratively using the self-paced algorithm. The expected research results will effectively promote the in-depth development of research on video saliency detection models and the related saliency-based applications.

近年来,随着机器学习等技术的应用,特别是深度学习技术,视频显著性检测模型的性能得到极大的提升,但这些模型存在两方面问题,即时空信息表征不充分和训练数据缺乏。因此,在包含诸如快速运动、背景杂乱、非刚性形变等复杂场景的视频数据上,这些模型的性能下降较为严重。为此,本项目针对上述两方面问题,提出三条新思路来有效提升视频显著性检测性能:1)构建基于时空信息多级复用的深度表征视频显著性检测模型,实现时域信息和空域信息在特征集成、显著性预测和显著性融合中的充分提取与利用;2)构建基于强时空关联的深度表征视频显著性检测模型,通过引入并强化视频序列中的帧间约束关系,得到具有强时空关联性的深度特征;3)构建无监督视频显著性检测通用框架,通过相似图像传播和多显著性图融合获取伪标签训练数据,进而利用自步学习算法,来迭代地提升模型性能。预期研究成果可以有效地推动视频显著性检测模型研究及其相关应用研究的深入发展。

项目摘要

近年来视频显著性检测已成为计算机视觉领域的一个热点研究方向,其是联合时域信息和空域信息,定位、凸显视频序列中的运动的显著性物体。目前,视频显著性检测已被广泛应用到诸如视频分割、视频编辑、视频编码、自动驾驶等领域。因此,可以说视频显著性检测研究是一个前沿、热点问题。为此,研究人员提出了众多的视频显著性检测模型,这些模型在一些包含简单场景的视频数据集上取得了不错的性能表现,但在包含有大量复杂场景(如快速运动、背景杂乱、非刚性形变、摄像机运动、运动模糊等)的视频数据集上,现有的视频显著性检测模型性能下降较为严重。为此,本课题组聚焦时空信息表征不充分和数据短缺问题,提出了基于时空集成网络的视频显著性检测模型、基于质量驱动的双分支特征集成网络的视频显著性检测模型和基于对抗学习的视觉显著型检测模型,有效提升了对复杂视频的显著性检测性能,从而推动了视频显著性检测模型研究及其相关应用的深入发展。同时,本课题组还针对光学遥感图像显著目标检测任务、表面缺陷检测任务、多模态场景如RGBD图像的视觉显著目标检测任务、光场图像显著目标检测任务、多幅图像协同显著目标检测与分割任务,构建了相应的模型算法。这些研究不仅对视频显著性检测研究有极强的借鉴意义,还有效推动了视觉显著性检测领域的发展。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
2

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

环境类邻避设施对北京市住宅价格影响研究--以大型垃圾处理设施为例

DOI:10.11821/dlyj020190689
发表时间:2020
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
5

城市轨道交通车站火灾情况下客流疏散能力评价

城市轨道交通车站火灾情况下客流疏散能力评价

DOI:
发表时间:2015

周晓飞的其他基金

批准号:61202226
批准年份:2012
资助金额:22.00
项目类别:青年科学基金项目

相似国自然基金

1

基于深度无监督分簇的混合监督图像语义分割方法研究

批准号:61906121
批准年份:2019
负责人:周雷
学科分类:F0604
资助金额:21.00
项目类别:青年科学基金项目
2

基于深度时空关系的视频关键点跟踪

批准号:61806196
批准年份:2018
负责人:朱翔昱
学科分类:F0605
资助金额:25.00
项目类别:青年科学基金项目
3

弱监督下的视频动作检测

批准号:61872333
批准年份:2018
负责人:卿来云
学科分类:F0210
资助金额:65.00
项目类别:面上项目
4

基于多层图分析的时空显著性检测方法研究

批准号:61602006
批准年份:2016
负责人:涂铮铮
学科分类:F0210
资助金额:20.00
项目类别:青年科学基金项目