As a fundamental problem in computer vision, image classification has drawn the interests of many researchers. Recently, the uses of sparse representation and deep learning become popular. However, the state-of-the-art methods are relatively independent and are not inherently correlated. We try to study the image classification problem by combining sparse representation with deep learning and solve the key problems of image classification. The main contents of our research can be summarized as follows. In order to get more discriminative image representation, we combine the spatial and structure information as well as sparse hierarchical Restricted Bolzman Machine along with the extraction and encoding of local features. We try to propose a robust spatial codebook generation method by improving over the traditional reconstruction error minimization based codebook generation algorithms. To reduce the encoding information loss, we propose a non-negative hierarchal sparse coding algorithm with smooth constraints. The smooth constraints are determined by the visual similarities of local features. Finally, we combine the sparse hierarchical deconvolutional network with codebook generation, local feature encoding and classifier training into a unified framework to improve the efficiency of image classification.
作为计算机视觉领域的一个基本问题,图像分类吸引了越来越多的研究人员的兴趣。近年来,基于稀疏表示、深度学习的方法在图像分类中获得了广泛的应用。但是,现有的研究方法相对独立,缺乏二者的有机结合。本项目旨在研究融合稀疏表示和深度分析的图像分类技术,并针对其中的关键科学问题展开深入探讨。主要研究内容包括:在稀疏层叠约束的限制波尔兹曼机中组合空间信息和结构信息,并与局部特征的提取、编码有机结合,从而得到更有代表性和判别力的图像表示;对最小化重构误差的视觉词典生成方法进行改进,提出一种鲁棒的空间视觉词典生成方法,抑制噪声干扰,提高图像分类效果;在局部特征编码时,考虑局部特征相似性和非负层次稀疏编码一致性的关系,以减小编码损失,更大程度上保持局部特征的判别信息;将稀疏层次反卷积网络与视觉词典生成、局部特征编码和分类器设计有机结合,达到统一、有效地进行图像分类的目的。
近年来,基于稀疏表示、深度学习的方法在图像分类中获得了广泛的应用。但是,现有的研究方法相对独立,缺乏二者的有机结合。本项目主要研究内容包括:在稀疏层叠约束的限制波尔兹曼机中组合空间信息和结构信息,并与局部特征的提取、编码有机结合,从而得到更有代表性和判别力的图像表示;对最小化重构误差的视觉词典生成方法进行改进,提出一种鲁棒的空间视觉词典生成方法,抑制噪声干扰,提高图像分类效果;在局部特征编码时,考虑局部特征相似性和非负层次稀疏编码一致性的关系,以减小编码损失,更大程度上保持局部特征的判别信息;将稀疏层次反卷积网络与视觉词典生成、局部特征编码和分类器设计有机结合,达到统一、有效地进行图像分类的目的。本项目在执行期间系统研究了基于稀疏表示和深度学习的图像分类方法,取得了良好的相关成果.共计发表论文20余篇.培养博士研究生1名,硕士研究生6名.对于相关问题的研究揭示了稀疏表示和深度学习技术在图像分类中的应用方法.对于后续的研究也起到了一定的启发作用.
{{i.achievement_title}}
数据更新时间:2023-05-31
演化经济地理学视角下的产业结构演替与分叉研究评述
内点最大化与冗余点控制的小型无人机遥感图像配准
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于细粒度词表示的命名实体识别研究
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
基于结构化稀疏表示与深度学习的图像增强及分类技术研究
融合概率图模型与深度学习的图像序列分类
基于稀疏表示和字典学习的深度图像序列人体行为识别
基于字典学习的小样本高光谱遥感图像稀疏表示分类精度研究与应用