基于大规模弱标注图像的分类器学习新方法研究

基本信息
批准号:61075014
项目类别:面上项目
资助金额:37.00
负责人:彭进业
学科分类:
依托单位:西北工业大学
批准年份:2010
结题年份:2013
起止时间:2011-01-01 - 2013-12-31
项目状态: 已结题
项目参与者:范建平,范建平,何贵青,杨雨奇,李青彦,夏召强,孔令斌,连宇
关键词:
大规模弱标注图像可伸缩分类器标注不确定性泛化能力图像主题网络
结项摘要

图像分类是计算机视觉和模式识别等领域的最基本科学问题之一,广泛应用于与军事和国民经济及社会生活密切相关的各种信息检索系统中。.在大规模网络图像分类与检索的应用中,传统分类器学习存在由于专业标注的训练样本集小,从而导致分类器泛化能力不强的问题,本项目针对这一问题,探索一种以大规模弱标注图像代替专业标注训练样本集的泛化能力强的分类器学习新方法。具体内容包括:1)研究大规模弱标注图像集中感兴趣标注与相应图像提取方法;2)研究基于标注不确定性处理的有意义图像主题和训练样本集筛选方法;3)研究图像的视觉相似性和语义相似性的描述及结合方式,建立准确的图像主题网络;4)研究基于主题网络的可伸缩分类器的学习方法;5)算法性能评价。.项目研究取得的突破将对信息学科及相关学科的发展产生较大影响,同时利用互联网信息进行学习的新思路也为其它相似应用中的分类器学习提供参考。

项目摘要

针对传统分类器学习存在的由于专业标注的训练样本集小从而导致分类器泛化能力不强的问题,本项目探索以大规模弱标注图像代替专业标注训练样本集的泛化能力强的分类器学习新方法,研究重点是解决标注不确定性处理等关键问题,主要研究内容包括:1)大规模弱标注图像集中感兴趣标注与相应图像提取方法;2)基于标注不确定性处理的有意义图像主题和训练样本集筛选方法;3)图像的视觉相似性和语义相似性的描述及结合方式,建立准确的图像主题网络;4)基于主题网络的可伸缩分类器的学习方法;5)算法性能评价。.项目主要成果及学术贡献体现在以下几个方面: 1)在标注提取方面,提出了一系列图像标签优化方法,如基于辅助文本的图像自动标注方法、基于多层聚类的图像垃圾标签净化方法、基于语义本体、正则化以及多示例学习的图像标签优化方法、基于随机游走的图像和社会标签对齐方法等,这些方法有效地减少了弱标注图像存在的标注不确定性对训练集有效性的影响;2)在训练图像提取方面,提出了基于搜索引擎和聚类的交互式垃圾图像过滤方法,有效地减少了弱标注图像的不确定性对训练集有效性的影响;3)在基于主题网络的分类器学习方面,提出了在视觉特征空间利用概念内视觉均匀性和概念间差异性无缝结合的语义鸿沟定量描述方法,为具有不同语义鸿沟概念的学习提供理论指导;提出了基于潜在语义分析以及弱标注图像的多示例学习算法,有效地提高了分类器性能。4)在基于主题网络的图像摘要方面,提出了基于AP聚类和稀疏表示的图像摘要选取方法,为基于主题网络的图像检索打下了基础。.结合相关研究已发表标注有基金号的学术论文38篇(SCI收录13篇、A类会议2篇),其中在《IEEE Transactions on Multimedia》等国际刊物上发表论文13篇,在CVPR等国际会议上发表论文12篇,其他核心期刊上发表论文13篇。2013年获得陕西省科学技术(基础研究类)二等奖。参加国际学术会议12篇次。培养博士生2名、硕士生2名。.图像分类是涉及计算机视觉、模式识别、机器学习和图像处理等多个领域重要和基本的科学问题之一,本项目所提出的利用大规模互联网信息进行分类器学习的新方法为从根本上促进图像分类器泛化能力提供一条新途径,该思路也可以推广应用于其它类型数据如大规模文本数据、语音数据等的分类、识别。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

路基土水分传感器室内标定方法与影响因素分析

路基土水分传感器室内标定方法与影响因素分析

DOI:10.14188/j.1671-8844.2019-03-007
发表时间:2019
2

祁连山天涝池流域不同植被群落枯落物持水能力及时间动态变化

祁连山天涝池流域不同植被群落枯落物持水能力及时间动态变化

DOI:10.13885/j.issn.0455-2059.2020.06.004
发表时间:2020
3

跨社交网络用户对齐技术综述

跨社交网络用户对齐技术综述

DOI:10.12198/j.issn.1673 − 159X.3895
发表时间:2021
4

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

自然灾难地居民风险知觉与旅游支持度的关系研究——以汶川大地震重灾区北川和都江堰为例

DOI:10.12054/lydk.bisu.148
发表时间:2020
5

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020

彭进业的其他基金

相似国自然基金

1

弱标注下基于主动学习的检测器适应问题研究

批准号:61202234
批准年份:2012
负责人:庞俊彪
学科分类:F0210
资助金额:24.00
项目类别:青年科学基金项目
2

基于网上弱标注数据的个性化图像标注研究

批准号:61303184
批准年份:2013
负责人:李锡荣
学科分类:F0211
资助金额:28.00
项目类别:青年科学基金项目
3

适于图像分类与标注的安全机器学习技术研究

批准号:61772262
批准年份:2017
负责人:李宇峰
学科分类:F0605
资助金额:67.00
项目类别:面上项目
4

基于神经主题模型的图像分类与标注

批准号:61563030
批准年份:2015
负责人:李晓旭
学科分类:F0604
资助金额:37.00
项目类别:地区科学基金项目