逆问题框架下的双目与运动图像视觉显著性分析

基本信息
批准号:61572387
项目类别:面上项目
资助金额:64.00
负责人:齐飞
学科分类:
依托单位:西安电子科技大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:吴金建,夏辰,李昊,陈超学,付兆海,沈冲,黄原成,刘薇
关键词:
栈式自动编码器视觉皮层视觉显著性稀疏编码字典学习
结项摘要

Investigation to the computational model of visual saliency is not only boosting the improvement of its related applications, but also helpful to the deepen our understanding to the human visual system. Considering the rapid development in the research on the inverse problem in recent years, this proposal suggests to reconsider the visual saliency analysis under the framework of inverse problem, which will improve the performance by developing new computational models and dig deep into the mechanism of the visual system. Under the framework of inverse problem, reconstruction errors are closely related to visual saliency. There are two efficient tools for solving the inverse problem, which are dictionary learning originated from compressed sensing and stacked auto-encoder developed by the deep learning community. In this project, we will create new approaches for visual saliency estimation based on these generative models for binocular and motion images. To achieve such goals, feature extraction methods, structures of generative models, and methods for learning parameters of the models will be investigated systematically. Our special focus will be on the following aspects. 1) The general framework will be developed for saliency estimation under the perspective of the inverse problem. 2) The computational model of visual saliency for binocular and moving images will be designed with a structure in accordance with the functional topology of the visual cortex. 3) In depth explanation of the proposed framework will be provided. The scientific problems of this project are summarized based on the thorough investigation of literature in visual cognition and deep learning, which should be conducted in the current new conditions. The method to be developed is invaluable in a wide range of applications including visual objects detection, image quality assessment, and video coding.

深入研究视觉显著性计算模型不仅能够促进相关应用性能的提升,亦有助于深化我们对人类视觉系统的理解。考虑到近年来逆问题研究的飞速发展,本项目从逆问题的角度重新审视视觉显著性分析问题,期望能够改善其计算模型的性能,深化对视觉系统工作机理的理解。在逆问题框架下,重构误差能够反映显著性。字典学习与栈式自动编码器是求解欠定的逆问题的有效工具,本项目拟研究基于这两种生成式模型估计视觉显著性的方法。为此将系统深入的研究双目与运动图像的特征提取方法、生成式模型的结构、参数学习方法等问题。其中重点研究:1)逆问题视角下视觉显著性分析的一般性框架;2)针对双目及运动图像,设计与视觉皮层功能结构一致的计算模型架构;3)模型合理性的理论阐释。本项目在大量调研视觉认知与深度学习等文献资料的基础上,总结出科学问题,基于新的条件进行研究,具有重要的理论意义,在目标检测、质量评价、视频编码等领域有广泛的应用价值。

项目摘要

本项目从逆问题求解的视角出发,以神经网络参数的经验学习作为求解逆问题的手段,以避免直接求解会遇到的病态问题。我们研究并构建了能够表征输入视觉刺激自身的深层编码-解码架构,建立了基于重构表征学习的模型用于视觉显著性估计。具体主要包括,提出了基于深层栈式自编码器的静态图像显著性估计方法;在此基础上,引入基于背景模型的采样方案改善了自编码器模型在双目/立体显著性的估计性能;进一步的,引入了迭代表示学习框架以解决人眼观察场景过程中动态扫视路径预测的问题。随着深度学习的发展,提出了表达能力更强的、基于现代卷积编码-解码结构的方法用于处理视觉输入中多实例竞争、分辨率损失等问题。同时本项目还研究了深度图像获取等一系列相关问题。本项目以视觉显著性估计研究为核心问题,围绕基于重构表征学习思路形成了一系列深度网络模型,较好地完成了预期研究任务,达到了预期目标。.

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019

齐飞的其他基金

批准号:91541201
批准年份:2015
资助金额:250.00
项目类别:重大研究计划
批准号:51878047
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:51378063
批准年份:2013
资助金额:80.00
项目类别:面上项目
批准号:20473081
批准年份:2004
资助金额:26.00
项目类别:面上项目
批准号:20533040
批准年份:2005
资助金额:190.00
项目类别:重点项目
批准号:51127002
批准年份:2011
资助金额:250.00
项目类别:专项基金项目
批准号:29803008
批准年份:1998
资助金额:11.00
项目类别:青年科学基金项目
批准号:60805012
批准年份:2008
资助金额:19.00
项目类别:青年科学基金项目
批准号:51108030
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:10775125
批准年份:2007
资助金额:36.00
项目类别:面上项目
批准号:U1332208
批准年份:2013
资助金额:300.00
项目类别:联合基金项目

相似国自然基金

1

基于视觉显著性的图像内容分析与检索

批准号:61175115
批准年份:2011
负责人:段立娟
学科分类:F0609
资助金额:58.00
项目类别:面上项目
2

网络环境下基于视觉显著性的图像检索

批准号:61472227
批准年份:2014
负责人:华臻
学科分类:F0207
资助金额:84.00
项目类别:面上项目
3

基于视觉显著性和稀疏表示的图像质量评价

批准号:61201394
批准年份:2012
负责人:张林
学科分类:F0116
资助金额:24.00
项目类别:青年科学基金项目
4

基于深度学习和双目视觉的深度图像估计及水下图像复原

批准号:61701463
批准年份:2017
负责人:俞智斌
学科分类:F0116
资助金额:27.50
项目类别:青年科学基金项目