Image and video have the characteristics of high dimension, obvious nonlinearity and complex internal structure. The representation and processing problems of image and video are always hot issues in both research and industry area. However, the traditional Euclidean space based methods generally do not consider the inherent nonlinear structure of complex high-dimensional data, thus the performance is not well. Orient to the unsupervised clustering of image and video, we utilize the manifold learning method to represent the image and video data, and establish multi-linear low rank models on manifold space to make learned features more suitable for clustering. For the representation of image and video, we adopt the manifold method as the representation approach to ensure the inner non-linear structure of image and video data. To achieve better clustering performance of image and video, we will built the multi-linear low rank model on manifold space. This project will break the limitation of the traditional Euclidean space based clustering model and provide a theoretical support and a new solution for the clustering of image and video.
图像视频数据具有维度高、非线性结构突出、内在结构复杂等特点,其表示和分析方法一直是学术界和工业界的热点研究问题。然而,传统基于欧氏空间度量的方法往往忽略了高维数据的内在特性,无法得到良好的效果。本项目面向图像视频的聚类应用,结合流形和低秩表示方法,重点研究图像视频的流形表达,并建立流形上的多线性低秩模型,使得学习得到的数据特征及其相似度矩阵更适合于聚类应用。针对图像视频等高维数据,研究面向图像视频的流形表示方法,以保证图像视频的内在非线性特性;在传统单一低秩表示模型的基础上,研究建立面向流形表示的多线性低秩表示模型,实现对图像视频的高效聚类。通过本项目的研究,将突破传统基于欧氏空间度量聚类模型以及单一低秩表示模型的局限性和不足,为图像视频等高维复杂数据的聚类问题提供新的解决方案。
本项目针对图像视频的聚类问题,以非线性流形表示方法为基础,重点研究图像视频等高维非结构数据的特征表示,同时扩展传统单一凸核函数的低秩表示模型,建立多线性低秩表示模型,同时引入图表示理论,得到更好的数据表示,实现图像视频的高效聚类。项目取得的主要理论成果包括:(1)针对图像视频等高维非结构数据的特征表示问题,分别提出图像的SPD流形表示方法、视频的Grassmann流形表示方法、以及多视角数据的异构流形表示方法;(2)对于不同的流形表示,扩展传统低秩表示方法,建立相应的多线性低秩表示模型,实现高效聚类;(3)结合图表示方法,建立图表示和低秩表示的聚类模型。项目研究取得了一系列创新性成果和知识产权,共发表学术论文7篇,全部为SCI、EI检索,获得国家发明专利授权1项。
{{i.achievement_title}}
数据更新时间:2023-05-31
EBPR工艺运行效果的主要影响因素及研究现状
基于铁路客流分配的旅客列车开行方案调整方法
针对弱边缘信息的左心室图像分割算法
基于LS-SVM香梨可溶性糖的近红外光谱快速检测
基于多色集合理论的医院异常工作流处理建模
流形上的低秩表示及其在图像视频聚类中的应用
基于低秩表示的图像视频编码方法研究
基于稀疏低秩表示的子空间聚类算法研究
流形空间不完整多视图像视频的聚类