Object detection is a fundamental problem in computer vision, which receives more and more attentions. Recent breakthroughs in object detection are driven by supervised approaches with deep convolutional neural networks. However, robust detectors rely on a large number of bounding box annotations, which is expensive and laborious to obtain. In order to reduce the annotation cost, weakly supervised detection using only image-level annotations has begun to attract attention and shown interesting results. To deal with the challenge of weakly supervised detection, this project will study on the following issues: explore the appearance consistency of the same objects and leverage knowledge from similar objects based on the consistency of local structures; jointly model the relationships between the objects and the background with scene-aware; model the similarity of the group with considering adaptive scale transformations of objects in crowds and further handle occlusions with reasoning. The project is expected to well settle weakly supervised detection under various scenarios, and promote the progress of this field.
物体检测是计算机视觉领域的基础性研究问题之一,具有重要的理论价值和广阔的应用前景。近年来,深度学习在物体检测领域取得突破性进展,但其性能严重依赖于大量精确标注数据。然而,标注需要耗费巨大的人工成本,使得精确标注数据的规模有限,此外大量数据由于标注不精确或无标注而无法被利用,限制了物体检测的进一步发展。为了降低标注成本并进一步提升物体检测性能,弱监督物体检测技术近年来受到广泛关注。本项目拟对弱监督物体检测这一前沿技术开展研究。研究内容包括:拟探索同类物体表观一致性建模,研究相似物体局部结构一致性及知识共享建模。进而,拟结合场景感知,针对多类物体关联性以及物体与背景关联性进行联合建模。最后,拟对密集场景下的弱监督检测问题构建群体相似性表达模型,构建遮挡鲁棒以及尺度自适应的检测方法,以应对密集物体检测的巨大挑战。本项目预期可以有效解决不同场景下弱监督检测问题,促进弱监督检测技术的发展。
物体检测与识别是计算机视觉领域的基础性研究问题之一,具有重要的理论价值和广阔的应用前景。近年来,深度学习在物体检测与识别领域取得突破性进展,但其性能严重依赖于大量精确标注数据。然而,标注需要耗费巨大的人工成本,使得精确标注数据的规模有限,此外大量数据由于标注不精确或无标注而无法被利用,限制了物体检测识别的进一步发展。..本项目针对弱监督学习问题,重点开展了三个方面的研究。在单一类别弱监督弹性建模方面,提出了仿射协变的自监督物体分割方法和基于局部结构一致性的人脸伪造检测方法,有效地利用了同一类别表观一致性约束和局部结构一致性约束,提升弱监督模型的鲁棒性。在多类别联合弱监督建模方面,提出了类别觉知的半弱监督物体分割方法,有效地挖掘物体与物体之间的关联关系,降低弱监督学习问题的学习难度。在遮挡鲁棒建模方面,提出了局部觉知的通道丢弃方法和基于可变形卷积的人脸显示对齐方法,显著地提升了模型在遮挡情况下的鲁棒性。上述研究成果对已有的弱监督学习理论和方法进行了有效补充,有效地解决不同场景下的弱监督检测识别问题,为弱监督学习技术的推广应用提供了良好的理论和方法指导。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
基于全模式全聚焦方法的裂纹超声成像定量检测
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
基于图卷积网络的归纳式微博谣言检测新方法
一种改进的多目标正余弦优化算法
弱监督视觉目标检测方法研究
弱监督的大规模网络异常检测方法研究
面向弱监督视觉目标检测的表征学习和模型优化问题研究
弱监督下的视频动作检测