基于深度表达和迁移学习的人体检测研究

基本信息
批准号:61502173
项目类别:青年科学基金项目
资助金额:20.00
负责人:吴斯
学科分类:
依托单位:华南理工大学
批准年份:2015
结题年份:2018
起止时间:2016-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:齐镗泉,张乾,廖晓伟,王景文,袁月,钱学成,黄艳
关键词:
迁移学习特征选择人体检测
结项摘要

With wide applications of visual surveillance, the need for intelligent monitoring system becomes very urgent. For the scenarios in which the monitoring object is human, the critical information is the time and place of human appearing, and human detection is an important step to obtain that. Great progress has been made in human detection in the past 20 years. For feature extraction and domain adaptation, many successful methods have been reported, though there is still room for improvement. In order to extract discriminative features for our task, we expect to employ deep convolutional neural network to learn the multi-level representation of images, stochastic spatial pooling to generate candidate features, and sparse support vector machine to select the important components from them. On the other hand, the difference between the distributions of source and target domain data may be significant because of the variety of application scenarios. As a result, domain adaptation is needed to solve this problem. Given a small number of labeling samples in the target domain, we propose to develop a cascaded classifier-based detector for which a transfer learning approach is used to build the nodes sequentially. Specifically, each node of a new cascade is constructed sparsely by the corresponding nodes of a set of pre-trained cascades such that the new detector has high generalization ability. This project will provide a promising way for human detection to boost its performance and improve its applicability.

随着视觉监控的广泛应用,对监控系统的智能化需求越来越迫切。对于监控对象是人的场景,人体出现的时间和位置是最关键的信息,而实现自动人体检测是获取这些信息的必要手段。对人体检测的研究在过去的20年有很大进展,但在特征学习和模型领域适应性方面仍有很大改进的空间。现有特征提取方法难以挖掘图像高层次信息,本课题拟采用深度卷积网络学习图像多层次表达,并且通过随机池化和基于稀疏支持向量机的特征选择算法获取多层次特征。我们拟提出基于级联模型的检测器,其中节点与多层次特征逐个关联。由于监控场景千差万别,源域与目标域数据分布之间可能存在很大差异,本项目拟采用迁移学习方法解决领域适应性问题。在给定少量目标域样本的情况下,我们拟采用基于模型的迁移学习策略,即通过预训练检测器稀疏组合构建新检测器,从而保证新检测器泛化能力强。本课题的开展将会为提升人体检测性能和增强其实用性提供新思路。

项目摘要

随着我国社会经济的快速发展,公共安全问题越来越被广泛重视,智能视频监控技术已成为提高公共安全的重要手段之一。人体检测是智能视频监控系统中最重要的环节,是后续识别、跟踪、行为分析等高级任务的基础。针对实际监控场景中人体检测任务的困难和挑战,以及现有检测模型并未针对少量标注情形进行充分设计,本项目主要围绕半监督学习,迁移学习及其在行人检测上的应用等几个方面开展创新性研究:1,半监督聚类: 提出了增量式半监督聚类集成模型,利用随机子空间,约束传播,子模型选择等技术,有效提高在高维数据空间的聚类性能,且该模型适用于包括数值,文本,图像等多种类型数据(IEEE TKDE 2016, PR 2016, PR 2019)。2,半监督分类:通过引入辅助聚类任务探索数据结构,提出了基于自步学习的跨任务深度神经网络,能够有效减少困难样本对模型训练的负类影响,从而提升在分类任务上的性能(IEEE TMM 2018)。3,模型迁移学习:针对公共数据集和实际监控场景之间存在显著差异,提出了基于选择性集成的迁移学习方法,能够利用在公共数据集上预训练检测模型中的有效成分重组构建适用于实际场景的行人检测模型,从而实现知识迁移(IEEE TIP 2018)。4,半监督行人检测:提出了基于半监督提升模型的行人检测方法,利用大量无标注数据扩充训练集,并采用基于图的特征选择算法发掘重要特征用于度量标注样本和无标注样本之间的相似性。在少量标注数据的情况下,能够显著改进实际监控场景的行人检测准确率。(PCM 2017,IEEE TCSVT 2018)。研究成果推动了半监督学习及行人检测领域的发展,具有较好的科学理论价值和工程应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

基于全模式全聚焦方法的裂纹超声成像定量检测

基于全模式全聚焦方法的裂纹超声成像定量检测

DOI:10.19650/j.cnki.cjsi.J2007019
发表时间:2021
4

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

水氮耦合及种植密度对绿洲灌区玉米光合作用和干物质积累特征的调控效应

DOI:10.3864/j.issn.0578-1752.2019.03.004
发表时间:2019
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

吴斯的其他基金

相似国自然基金

1

基于深度强化学习的人脸关键点检测

批准号:61806104
批准年份:2018
负责人:刘昊
学科分类:F0605
资助金额:24.00
项目类别:青年科学基金项目
2

交通场景下基于深度和迁移学习的行人检测与跟踪方法的研究

批准号:61471154
批准年份:2014
负责人:孙锐
学科分类:F0116
资助金额:81.00
项目类别:面上项目
3

基于深度学习和迁移学习的对流新生临近预报方法研究

批准号:41875049
批准年份:2018
负责人:韩雷
学科分类:D0501
资助金额:62.00
项目类别:面上项目
4

基于深度学习和迁移学习的东盟跨语言查询扩展研究

批准号:61762006
批准年份:2017
负责人:黄名选
学科分类:F0211
资助金额:41.00
项目类别:地区科学基金项目