In the existed image compression frameworks, the basis expansion( i.e. DCT and Wavelets) intends to express any arbitrary signal with a finite function or vector, while neglecting the feature of signal per se, while the statistical modeling(i.e. Sparse coding) of image representation attempts to explore model space which correspondents to the signal feature through analyzing human visual system.In this project, First of all,we introduce the concept of image modelibility and computing method in order to settle the theoretical basis of our research. Image modelibility reveals the image's adaptation capacity to the model space. The adaptation capacity per se, is measured by two factors: the uncertainty generated when images select the most optimized dictionary and The coding gain brought by multi dictionary library.Through introducing the redundancy with modelibility, the conclusion is that the process of extraction of image feature and establishment of targeted dictionary library is of the same equivalence of the eradication of image redundancy. Then we settle the most optimized dictionary library of seven common scenarios or targets', including indoor scenarios, outdoor scenarios, human bodies, human faces, vehicles, plants and constructions. This research is based on image extraction encoding frame of image modelibility theory, i.e. an optimized encoding method, which used minimized energy function based on image modelibility equation, along with the corresponding atom parameters computation method, quantitative strategy, parameter entropy coding and optimized theory.
现有的图像编码框架中,以DCT、小波变换为代表的基于基展开的编码方式没有考虑图像信号本身的特征,而以稀疏分解为代表的基于统计建模的图像编码又不能满足模型空间普适性的要求。针对这一问题,本项目通过引入图像广义建模理论进行图像的统计特性分析,并由此开展多原子库模型下的图像编码框架的研究。首先,提出基于图像广义建模理论的信息度量方法,在综合考虑多模型空间带来的图像在选择最优原子库时产生的不确定性以及多原子库带来的图像总体编码增益的情况下,将编码转化为最小化能量函数的优化问题;其次在定义广义建模性冗余的概念后,将图像建立有针对性的原子库的过程等价为图像广义建模性冗余去除的过程,由此提出一种基于特征区域提取的模型空间优化方法;最后,配合相应的参数提取方法,量化策略,熵编码方案以及优化理论,以最小化广义建模能量函数为目标提出一种多原子库图像优化编码框架,从而为图像/视频处理技术的发展开辟一条新的途径。
本项目致力于进行一种不同于现有图像编码框架研究的尝试,将编码问题转化为一种最小化能量函数的优化问题进行解决,主要研究贡献包括四个方面。第一,建立多模式下的图像广义建模理论并形成图像多模式优化编码框架。针对每一个图像基本单元寻求不同的模式进行编码,相较于所有图像处理单元使用同一个模式进行编码能够得到更大的压缩率,我们将这些采用多模式情形下进一步去除的图像冗余称为模式冗余。同时,模式冗余的去除是以增加模式索引信息为代价的,因此,使用多模式进行图像编码的过程是一个平衡模式冗余的减少与索引信息增加的过程。本项目通过定义图像的广义建模性以衡量多模式情形下图像的信息量,从而形成了一种新的指导图像与视频编码的理论。第二,在图像信息构成分析研究方面,提出一种具有任意图像方向性划分的滤波器组的结构与设计方法。针对图像中的方向性特征信息的提取,提出了一种基于空间域方向滤波器组的实现方法,可以实现单个滤波器的线性相位,并支撑滤波器下的完全重构,适用于提取图像中具有空间域局部化特性的边缘轮廓。所设计的方向滤波器组具有任意数目的非均匀子带,可以根据图像的方向信息分布高效地提取图像中的几何轮廓和纹理信息。第三,借助于计算机视觉领域内的图像检索和分类技术,从图像内容相似性分析出发发掘图像间的内容相关性,进行了同一存储空间中不同图像之间可供压缩的图像内容相似性分析,并依靠图像数据库的支持,建立具有相似图像之间的关联并形成图像类别上的多模式,形成一种基于图像相似性分析的图像多模式优化编码框架。第四,进行多模式优化建模理论在图像处理领域中的应用验证,包括基于多线索融合深度生成算法的立体视频转换方法、基于多字典学习的图像超分辨率方法研究等。本项目的研究以图像分析与图像压缩过程的统一为目标,为图像/视频处理技术的发展开辟一条新的途径。
{{i.achievement_title}}
数据更新时间:2023-05-31
多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法
针对弱边缘信息的左心室图像分割算法
基于改进LinkNet的寒旱区遥感图像河流识别方法
基于旋量理论的数控机床几何误差分离与补偿方法研究
信息熵-保真度联合度量函数的单幅图像去雾方法
图像多描述编码方法研究
总广义变差在图像恢复中的建模理论及其算法研究
基于不同兴趣度的任意形状多感兴趣区图像编码方法研究
基于低秩表示的图像视频编码方法研究