融合多尺度上下文的图像标注研究

基本信息
批准号:61401228
项目类别:青年科学基金项目
资助金额:25.00
负责人:周全
学科分类:
依托单位:南京邮电大学
批准年份:2014
结题年份:2017
起止时间:2015-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:魏昕,张旭光,张爱清,赵聘,徐璐
关键词:
语义标注图像理解多尺度上下文语义分割图像标注
结项摘要

Multi-class object labeling in nature images is a challenging problem in the fields of computer vision and image processing. Efficient usage of contextual information is benefit to improve the recognition accuracy for different objects and regions. The current labeling methods, however, often neglect the multi-scale characteristic of contextual information, which indicates different scale context provides different visual information, leading to the insufficient usage of image contextual cues. In order to extend the theoretical system of image labeling and image understanding, this project aims to propose a novel image labeling framework based on fusing multi-scale contextual information. The main research topics and innovations of this project include: due to the unknown characteristic of object scale, we propose an image representation approach using dynamic segmentation graph, which mainly addresses the problem of selecting apposite scale visual context to represent object class; research on a robust multi-scale feature descriptor, which mainly addresses the problem of describing visual context in different scales; in order to utilize the complementary and difference of contextual information within different scales, we propose a multi-scale context fusing model, which mainly addressed the formulation problem to balance model complexity and labeling performance.

对自然图像中的物体进行自动标注,以达到图像理解的目的是计算机视觉和图像处理领域的研究热点问题。充分利用每幅图像中蕴含的上下文信息,有助于提高图像中物体和区域的识别准确率。但是,现有的图像标注方法往往忽视了上下文信息的多尺度特性,即不同尺度上的上下文提供不一样的视觉信息,从而导致图像中蕴含的上下文信息没有得到充分地利用。为此,本项目旨在提出一种全新的融合多尺度上下文的图像标注框架,以扩展现有图像标注与图像理解的理论体系。本项目具体的研究内容和创新点包括:根据物体尺度信息未知的特性,提出一种动态分割图的多尺度上下文表达方法,解决选择合适尺度上下文信息来表达不同类别物体的问题;提出一种鲁棒的多尺度上下文描述符,由于上下文信息具有多尺度特性,因此所设计的描述符必须也具有多尺度特性;利用不同尺度上下文之间的差异性和互补性,提出一种多尺度上下文融合模型,解决平衡模型复杂度以及提高标注性能的建模问题。

项目摘要

该项目以心理学实验为理论依据,从人眼视觉对自然图像感知的角度,利用图像中不同尺度的上下文信息来研究图像语义分割问题。为此,本项目从多尺度上下文表达和多尺度上下文建模两个方面进行研究。重点考虑了基于动态分割图的上下文表达方法、鲁棒的多尺度上下文描述子以及连续贝叶斯线性建模等方面。提出基于混合动态马尔科夫随机场的图像语义分割方法以及利用动态分割图编码的多尺度上下文图像语义分割方法。此外本项目还根据语义分割领域的进展,将研究进一步扩展到利用深度卷积网络建模图像上下文的语义分割方法,具体包括基于多尺度全卷积网络的图像语义分割以及基于稠密编解码网络的弱监督图像语义分割方法。此外,本项目还探索了图像语义分割的相关领域:显著性前景物体检测与分割以及人脸对齐与识别。在显著性前景物体检测与分割方面,本项目提出动态对比度度量融合的显著性检测方法以及基于背景区域抽取的显著性物体检测方法;在人脸对齐与识别方面,本项目提出基于SIFT 特征流和低秩稀疏表达的人脸对齐与识别方法以及基于低秩稀疏分解的人脸超分辨率重建机制。理论分析和仿真实验验证了上述算法的有效性。. 本项目在国内外重要学术期刊和学术会议上发表论文33 篇,其中SCI 检索18 篇,EI检索32 篇。其中包括JCR 二区以上论文7 篇以及会议最佳学生论文1 篇,并被国际会议邀请做特邀报告1 次,Google Scholar 显示论文总引用率超过100 余次。申请发明专利5 项。此外,在青年基金项目的依托下,申请人还主持承担了1 项国家自然科学基金国际间合作与交流项目。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
2

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
3

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
4

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
5

桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究

桂林岩溶石山青冈群落植物功能性状的种间和种内变异研究

DOI:10.5846/stxb202009292521
发表时间:2021

周全的其他基金

批准号:81702385
批准年份:2017
资助金额:21.00
项目类别:青年科学基金项目
批准号:11002085
批准年份:2010
资助金额:25.00
项目类别:青年科学基金项目
批准号:61876093
批准年份:2018
资助金额:65.00
项目类别:面上项目
批准号:51261026
批准年份:2012
资助金额:50.00
项目类别:地区科学基金项目
批准号:21707098
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:61802137
批准年份:2018
资助金额:26.00
项目类别:青年科学基金项目
批准号:81471659
批准年份:2014
资助金额:73.00
项目类别:面上项目
批准号:81401187
批准年份:2014
资助金额:23.00
项目类别:青年科学基金项目
批准号:11572185
批准年份:2015
资助金额:66.00
项目类别:面上项目

相似国自然基金

1

面向图像标注的上下文感知深度核映射网络方法研究

批准号:61806180
批准年份:2018
负责人:酒明远
学科分类:F0604
资助金额:24.00
项目类别:青年科学基金项目
2

基于多模态融合的互联网图像中人物行为标注研究

批准号:61772319
批准年份:2017
负责人:李晋江
学科分类:F0207
资助金额:69.00
项目类别:面上项目
3

基于多尺度分析的图像融合方法研究

批准号:61772237
批准年份:2017
负责人:罗晓清
学科分类:F0210
资助金额:58.00
项目类别:面上项目
4

融合图像质量特性的视觉对象类别标注方法研究

批准号:60802055
批准年份:2008
负责人:肖柏华
学科分类:F0116
资助金额:24.00
项目类别:青年科学基金项目