本项目开展面向网络弱标记图像的视觉对象模型在线学习研究,这一方法可以有效地降低手工标注图像库规模小和人为偏好带来的负面影响。提出马尔可夫LDA(latent dirichelet allocation)模型,该模型充分考虑了视觉词汇间的上下文关系,放宽了传统模型严格的独立性假设要求;针对该模型,采用增量期望最大(IEM)算法,实现在线学习;提出基于加权的样本采样策略,降低模型的训练规模;研究马尔可夫LDA模型下的计算学习理论,并指导设计数据编辑操作策略,从而得到可靠的增量训练集合,避免模型在线学习过程中出现概念漂移问题。最后,通过在图像检索系统中应用,验证方法的有效性。本项目对研究视觉对象新模型、发展网络图像检索方法以及促进图像理解与机器学习的结合都具有重要的意义。
本项目开展面向网络弱标记图像的视觉对象模型在线学习研究,该项研究主要目标为设计一个适当的视觉对象模型,并能够在弱标记环境下对模型参数实现在线学习算法。具体开展了如下一些关键技术研究:研究网络环境下大规模图像数据的应用,该研究途径可以有效地降低手工标注图像库规模小和人为偏好带来的负面影响;研究马尔可夫 LDA(latent dirichelet allocation)模型,该模型充分考虑了视觉词汇间的上下文关系,放宽了传统模型严格的独立性假设要求;结合深度学习的主题模型;研究针对该模型的在线训练算法,及并行参数估计;研究基于加权的样本采样策略,降低模型的训练规模,同时研究面向大数据的并行采样估计算法;研究基于稀疏编码的视觉词汇构造方法,从而避免手工设计视觉特征带来的问题;研究弱标记下的视觉对象分割与检测技术,扩大了该项研究的应用范围,并为后续研究提供了新的思路。上述几种方法在国际上通用的公开测试数据库(Voc2010,Bsd300,ImageNet)上与当前效果比较好的方法进行了比较,无论是在分类或者分割效果上,还是在运行速度上都取得了更好成绩。在完成申请书中所要研究内容外,本项目还加强了与深度学习结合的研究,目前看也取得了比较好的结果。.经过4年的努力,圆满完成了本项目的任务要求,并在局部有超额,主要体现在基于稀疏编码的视觉词汇构造方面。本项目共发表论文22篇,其中国际期刊论文6篇、国内一级学报论文2篇、国际会议论文10篇,翻译国外教材1部。结合本项目研究工作,培养博士生4人(已毕业2人)、硕士生7人(已毕业4人);申请发明专利1项。
{{i.achievement_title}}
数据更新时间:2023-05-31
跨社交网络用户对齐技术综述
粗颗粒土的静止土压力系数非线性分析与计算方法
基于SSVEP 直接脑控机器人方向和速度研究
温和条件下柱前标记-高效液相色谱-质谱法测定枸杞多糖中单糖组成
内点最大化与冗余点控制的小型无人机遥感图像配准
弱监督在线学习方法及其在视觉目标跟踪中的应用
面向网络图像检索的弱监督多模态跨域机器学习方法研究
面向弱监督视觉目标检测的表征学习和模型优化问题研究
面向弱监督学习的多标记矩阵补全模型及其扩展研究