显著视觉相似性度量模型及应用

基本信息

批准号：61572207

项目类别：面上项目

资助金额：67.00

负责人：刘文予

学科分类：

依托单位：华中科技大学

批准年份：2015

结题年份：2019

起止时间：2016-01-01 - 2019-12-31

项目状态：已结题

项目参与者：李超,李弼,唐芃,郭宏运,姜玉静,肖健

关键词：

运动跟踪深度学习显著性传播算法相似性度量

结项摘要

Visual similarity is one of the fundamental problems in computer vision and pattern recognition. This project proposes a novel saliency-based visual similarity model, which employs global formulation. It integrates the studies of feature representation, high-level feature and similarity function into a unified framework. The proposed method is robust and adaptive. Meanwhile, it avoids local minimum in optimization, overcomes the sensitivity of feature representation and bypasses the uncertainty in visual matching. This general-purpose method is computational efficiency. And it can be used in various vision applications, such as object detection and recognition. In this project, we select video analysis and image retrieval as case study to demonstrate the superior of the proposed method.

相似性度量是计算机视觉、模式识别等领域中核心和基础性的问题。本项目提出了一种新的显著视觉相似性度量模型，该模型采用全局建模方式，将底层特征表达函数、高层语义表征模型和相似性度量建模到统一框架中，在满足整体模型约束的条件下求解各个部分参数，从而保证了模型的全局最优性。该模型具有良好的适用性、鲁棒性和可扩展性。解决了传统方法建模过程中存在的“局部最优性”以及算法设计过程中特征表达的不稳定性和度量的特征敏感性等问题，提高了相似性度量的准确性和鲁棒性。该模型不依赖于特定的问题，计算快速有效，能广泛应用于目标表示、物体检测与识别、运动分析等领域。本项目提出显著视觉相似性度量模型，并给出其在视频的运动分析和大数据库图像检索中的应用，将极大的促进计算机视觉领域中以相似性度量算法为核心的多种应用的发展。

项目摘要

相似性度量意在解决如何有效的度量两个物体间的距离，已成为计算机视觉、模式识别等领域长期的基础性问题。在传统的相似性度量中，数据的底层特征表示、高层语义表征模型以及距离度量方法是三个至关重要的部分，如何将这三个部分整合到统一框架中，从而解决每个部分是局部最优而不是整体最优是本项目研究的重要课题。针对以上问题，本项目的主要研究内容包括：（1）显著性视觉相似性度量的理论研究，包括基于多特征融合的自适应相似性度量方法、显著视觉相似性度量的数学模型构造等，以解决整体最优的问题；（2）结合视觉显著性的高效图像特征表示的理论研究；（3）基于高效的图像特征表示与显著视觉相似性度量理论的应用，包括弱监督下高效的图像表征方法、自然场景中文字特征的表示方法、行人重识别中的距离度量方法等。.围绕以上研究内容，项目前期主要研究成果包括：（1）提出了两种显著视觉相似性度量的数学模型构造方法，高效快速的基于马氏距离的自适应度量学习方法和复杂场景下基于超球面的相似性度量方法，解决整体最优的问题；（2）为挖掘不同特征表达方式之间的互补性，提出一种基于多特征融合的自适应相似性度量方法；（3）提出多种高效的图像特征表示方法，其中包括：为保证图像特征表示的多样性，提出一种基于多示例学习的图像多模式特征的表征模型；为保证中层图像表达的高效性，提出一种利用lasso正则化提取不同类别间共享的表征模式的方法。.相比较传统的分步的手工设计的特征而言，深度神经网络中以数据为驱动，整合图像低层、中层、高层特征表达以及模式判别为一体的理念，为项目中将图像的特征表达与相似性度量整合到统一框架的目标提供了有力的实现途径。通过将本项目的研究成果与深度神经网络相结合，产生大量高效、实用的应用，项目后期主要研究成果包括：（1）将度量学习理论和深度神经网络中的注意力机制相结合，提出一种利用基于注意力机制获取图像显著性特征的行人重识别方法；（2）提出一种通过相似性度量将多个显著性区域聚合为单一区域的端到端神经网络的方法来解决弱监督物体检测的问题；（3）针对深度神经网络感受野有限的问题，提出一种利用特征相似性来融合上下文信息的物体分割方法。.显著相似性度量理论并不局限于单一的应用，通过和深度神经网络整合为统一的框架，极大促进了大量的实际应用，包括：自然场景文字检测与识别、通用物体检测、手势识别、行人重识别、视频中物体的跟踪等。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：

发表时间：2021

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.19328/j.cnki.2096-8655.2022.02.002

发表时间：2022

DOI：10.1360/SSM-2020-0035

发表时间：2020

DOI：10.13973/j.cnki.robot.210412

发表时间：2022

刘文予的其他基金

批准号：60273099

批准年份：2002

资助金额：7.00

项目类别：面上项目

批准号：60372067

批准年份：2003

资助金额：6.00

项目类别：面上项目

批准号：69973018

批准年份：1999

资助金额：13.00

项目类别：面上项目

批准号：60572063

批准年份：2005

资助金额：23.00

项目类别：面上项目

批准号：61733007

批准年份：2017

资助金额：270.00

项目类别：重点项目

批准号：61173120

批准年份：2011

资助金额：56.00

项目类别：面上项目

批准号：60873127

批准年份：2008

资助金额：33.00

项目类别：面上项目

相似国自然基金

物体形状部分视觉显著性度量及其应用

批准号：61501208

批准年份：2015

负责人：赖重远

学科分类：F0113

资助金额：19.00

项目类别：青年科学基金项目

基于深度层次特征相似性度量的视觉跟踪方法研究

批准号：61773397

批准年份：2017

负责人：查宇飞

学科分类：F0604

资助金额：65.00

项目类别：面上项目

视觉注意模型及其在显著目标检测中的应用研究

批准号：61401281

批准年份：2014

负责人：张晴

学科分类：F0113

资助金额：23.00

项目类别：青年科学基金项目

基于多尺度分割的视觉显著性模型及其应用研究

批准号：61171144

批准年份：2011

负责人：刘志

学科分类：F0116

资助金额：60.00

项目类别：面上项目

显著视觉相似性度量模型及应用

{{i.achievement_title}}

暂无此项成果

其他相关文献

基于铁路客流分配的旅客列车开行方案调整方法

新型树启发式搜索算法的机器人路径规划

"多对多"模式下GEO卫星在轨加注任务规划

现代优化理论与应用

基于自适应干扰估测器的协作机器人关节速度波动抑制方法

刘文予的其他基金

基于广义条件骨架的三维图形识别新方法研究

无线信道下的信道广义率失真模型研究

基于形态学的非刚体运动及变形的新方法研究

无线移动环境下复杂度可分级联合功率率失真模型

面向网络信息安全的图像视频中的文字语义理解理论与方法

数据集多尺度特征提取与表达的视觉凹度方法

广义凸分解理论及应用

相似国自然基金