显著视觉相似性度量模型及应用

基本信息
批准号:61572207
项目类别:面上项目
资助金额:67.00
负责人:刘文予
学科分类:
依托单位:华中科技大学
批准年份:2015
结题年份:2019
起止时间:2016-01-01 - 2019-12-31
项目状态: 已结题
项目参与者:李超,李弼,唐芃,郭宏运,姜玉静,肖健
关键词:
运动跟踪深度学习显著性传播算法相似性度量
结项摘要

Visual similarity is one of the fundamental problems in computer vision and pattern recognition. This project proposes a novel saliency-based visual similarity model, which employs global formulation. It integrates the studies of feature representation, high-level feature and similarity function into a unified framework. The proposed method is robust and adaptive. Meanwhile, it avoids local minimum in optimization, overcomes the sensitivity of feature representation and bypasses the uncertainty in visual matching. This general-purpose method is computational efficiency. And it can be used in various vision applications, such as object detection and recognition. In this project, we select video analysis and image retrieval as case study to demonstrate the superior of the proposed method.

相似性度量是计算机视觉、模式识别等领域中核心和基础性的问题。本项目提出了一种新的显著视觉相似性度量模型,该模型采用全局建模方式,将底层特征表达函数、高层语义表征模型和相似性度量建模到统一框架中,在满足整体模型约束的条件下求解各个部分参数,从而保证了模型的全局最优性。该模型具有良好的适用性、鲁棒性和可扩展性。解决了传统方法建模过程中存在的“局部最优性”以及算法设计过程中特征表达的不稳定性和度量的特征敏感性等问题,提高了相似性度量的准确性和鲁棒性。该模型不依赖于特定的问题,计算快速有效,能广泛应用于目标表示、物体检测与识别、运动分析等领域。本项目提出显著视觉相似性度量模型,并给出其在视频的运动分析和大数据库图像检索中的应用,将极大的促进计算机视觉领域中以相似性度量算法为核心的多种应用的发展。

项目摘要

相似性度量意在解决如何有效的度量两个物体间的距离,已成为计算机视觉、模式识别等领域长期的基础性问题。在传统的相似性度量中,数据的底层特征表示、高层语义表征模型以及距离度量方法是三个至关重要的部分,如何将这三个部分整合到统一框架中,从而解决每个部分是局部最优而不是整体最优是本项目研究的重要课题。针对以上问题,本项目的主要研究内容包括:(1)显著性视觉相似性度量的理论研究,包括基于多特征融合的自适应相似性度量方法、显著视觉相似性度量的数学模型构造等,以解决整体最优的问题;(2)结合视觉显著性的高效图像特征表示的理论研究;(3)基于高效的图像特征表示与显著视觉相似性度量理论的应用,包括弱监督下高效的图像表征方法、自然场景中文字特征的表示方法、行人重识别中的距离度量方法等。.围绕以上研究内容,项目前期主要研究成果包括:(1)提出了两种显著视觉相似性度量的数学模型构造方法,高效快速的基于马氏距离的自适应度量学习方法和复杂场景下基于超球面的相似性度量方法,解决整体最优的问题;(2)为挖掘不同特征表达方式之间的互补性,提出一种基于多特征融合的自适应相似性度量方法;(3)提出多种高效的图像特征表示方法,其中包括:为保证图像特征表示的多样性,提出一种基于多示例学习的图像多模式特征的表征模型;为保证中层图像表达的高效性,提出一种利用lasso正则化提取不同类别间共享的表征模式的方法。.相比较传统的分步的手工设计的特征而言,深度神经网络中以数据为驱动,整合图像低层、中层、高层特征表达以及模式判别为一体的理念,为项目中将图像的特征表达与相似性度量整合到统一框架的目标提供了有力的实现途径。通过将本项目的研究成果与深度神经网络相结合,产生大量高效、实用的应用,项目后期主要研究成果包括:(1)将度量学习理论和深度神经网络中的注意力机制相结合,提出一种利用基于注意力机制获取图像显著性特征的行人重识别方法;(2)提出一种通过相似性度量将多个显著性区域聚合为单一区域的端到端神经网络的方法来解决弱监督物体检测的问题;(3)针对深度神经网络感受野有限的问题,提出一种利用特征相似性来融合上下文信息的物体分割方法。.显著相似性度量理论并不局限于单一的应用,通过和深度神经网络整合为统一的框架,极大促进了大量的实际应用,包括:自然场景文字检测与识别、通用物体检测、手势识别、行人重识别、视频中物体的跟踪等。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
2

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法

DOI:10.19596/j.cnki.1001-246x.8419
发表时间:2022
3

物联网中区块链技术的应用与挑战

物联网中区块链技术的应用与挑战

DOI:10.3969/j.issn.0255-8297.2020.01.002
发表时间:2020
4

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022
5

一种改进的多目标正余弦优化算法

一种改进的多目标正余弦优化算法

DOI:
发表时间:2019

刘文予的其他基金

批准号:60273099
批准年份:2002
资助金额:7.00
项目类别:面上项目
批准号:60372067
批准年份:2003
资助金额:6.00
项目类别:面上项目
批准号:69973018
批准年份:1999
资助金额:13.00
项目类别:面上项目
批准号:60572063
批准年份:2005
资助金额:23.00
项目类别:面上项目
批准号:61733007
批准年份:2017
资助金额:270.00
项目类别:重点项目
批准号:61173120
批准年份:2011
资助金额:56.00
项目类别:面上项目
批准号:60873127
批准年份:2008
资助金额:33.00
项目类别:面上项目

相似国自然基金

1

物体形状部分视觉显著性度量及其应用

批准号:61501208
批准年份:2015
负责人:赖重远
学科分类:F0113
资助金额:19.00
项目类别:青年科学基金项目
2

基于深度层次特征相似性度量的视觉跟踪方法研究

批准号:61773397
批准年份:2017
负责人:查宇飞
学科分类:F0604
资助金额:65.00
项目类别:面上项目
3

视觉注意模型及其在显著目标检测中的应用研究

批准号:61401281
批准年份:2014
负责人:张晴
学科分类:F0113
资助金额:23.00
项目类别:青年科学基金项目
4

基于多尺度分割的视觉显著性模型及其应用研究

批准号:61171144
批准年份:2011
负责人:刘志
学科分类:F0116
资助金额:60.00
项目类别:面上项目