基于结构化深度学习的场景理解

基本信息

批准号：61872364

项目类别：面上项目

资助金额：63.00

负责人：卢汉清

学科分类：

依托单位：中国科学院自动化研究所

批准年份：2018

结题年份：2022

起止时间：2019-01-01 - 2022-12-31

项目状态：已结题

项目参与者：陈盈盈,郭海云,李成华,史磊,高云泽,朱优松,周鲁

关键词：

场景理解深度学习图像表征深度估计结构化模型

结项摘要

In this proposal, we aim to systematically study on structured deep learning based scene understanding. We propose to design proper deep neural networks, in order to overcome the shortcomings of the traditional models on the lack of ability on image feature representation. We integrate deep neural networks and probabilistic graphical models to study the structured deep learning problem. we propose a model which combines convolutional neural networks (CNN) and continuous conditional random fields (CCRF) in a unified deep learning framework. CNN can extract rich related features from image, and CCRF can optimize the output of CNN according to the position and color information of the image pixels. We also propose a model to fuse sparse known labels. By using these known labels, we can provide our model a few relatively accurate depth value as a reference, and largely narrow down the range of reasonable depth value of other pixels. Thus the model can reduce the ambiguity of mapping a single RGB image into depth map to some extent. We investigate the multi-task learning problem on both depth estimation and semantic segmentation. By addressing the problems studied in this proposal, the vision based scene understanding theory and technique can be further developed.

本项目旨在研究基于结构化深度学习的图像场景理解问题，通过合理设计和架构深度学习网络模型，克服传统方法在图像特征表达能力方面的不足；将深度学习模型与概率图模型相结合，研究统一的结构化深度学习框架，解决传统深度学习模型输出缺乏结构化约束、空间结构信息丢失的问题；面向大规模应用数据，研究结构化输出模型的快速推断方法，以避免巨大的计算代价；在深度学习模型中引入可以通过较低成本获取的稀疏先验信息，研究先验信息的融合方法，以减少单幅图像到深度图之间映射的不确定性。研究图像的深度估计和语义分割的多任务学习，实现两个任务的共同增强。本项目的研究将促进基于视觉的场景理解理论和技术的发展，为机器人、无人车等技术的推进和发展提供有力的保障。

项目摘要

本项目深入研究了基于结构化深度学习的图像场景理解问题。围绕场景语义描述、语义分割、深度估计等计算机视觉关键科学问题展开系统研究，提出了新颖的方法，取得了一定的成果，包括：面向场景分析的自适应上下文神经网络模型、基于反事实多智能体强化学习的非自回归场景语义描述模型、基于多视图特征与混合奖励的场景语义描述方法、基于双重关系感知注意网络的场景解析方法、基于连续条件随机场的单目图像场景深度估计神经网络等。项目组共发表论文11篇，其中发表期刊论文4篇，发表高水平国际会议论文7篇。本项目的研究将促进基于视觉的场景理解理论和技术的发展，为机器人、无人车等技术的推进和发展提供有力的保障。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.3778/j.issn.1002-8331.1911-0012

发表时间：2020

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.16383/j.aas.c180673

发表时间：2021

DOI：10.3724/SP.J.1089.2019.17435

发表时间：2019

卢汉清的其他基金

批准号：60475010

批准年份：2004

资助金额：24.00

项目类别：面上项目

批准号：60833006

批准年份：2008

资助金额：190.00

项目类别：重点项目

批准号：61070104

批准年份：2010

资助金额：32.00

项目类别：面上项目

相似国自然基金

基于深度学习的装配场景理解及装配诱导、监测研究

批准号：51475251

批准年份：2014

负责人：陈成军

学科分类：E0510

资助金额：80.00

项目类别：面上项目

基于深度强化学习的大尺度人群监控场景理解研究

批准号：61771303

批准年份：2017

负责人：杨华

学科分类：F0117

资助金额：62.00

项目类别：面上项目

基于场景语意理解和深度学习特征表述的视频行为分析研究

批准号：61602014

批准年份：2016

负责人：李楠楠

学科分类：F0210

资助金额：21.00

项目类别：青年科学基金项目

基于超体素深度特征学习的室内点云场景分割与理解

批准号：61802294

批准年份：2018

负责人：罗楠

学科分类：F0209

资助金额：27.00

项目类别：青年科学基金项目

基于结构化深度学习的场景理解

{{i.achievement_title}}

暂无此项成果

其他相关文献

针对弱边缘信息的左心室图像分割算法

一种基于多层设计空间缩减策略的近似高维优化方法

基于改进LinkNet的寒旱区遥感图像河流识别方法

二维FM系统的同时故障检测与控制

信息熵-保真度联合度量函数的单幅图像去雾方法

卢汉清的其他基金

基于事件的体育视频分析

面向无线网络环境的个性化视频定制及适配关键技术

基于上下文隐式概念模型的图像与视频分类研究

相似国自然基金