面向多人交互行为分析的大规模视频图像识别与理解模型

基本信息
批准号:61472456
项目类别:面上项目
资助金额:80.00
负责人:郑伟诗
学科分类:
依托单位:中山大学
批准年份:2014
结题年份:2018
起止时间:2015-01-01 - 2018-12-31
项目状态: 已结题
项目参与者:张建国,任传贤,朱俊勇,胡建芳,吴建生,黄昭源,李翔,常晓斌,麦宇庭
关键词:
特征提取图像识别计算机视觉
结项摘要

Collective activity analysis, which concerns the collective behavior of pedestrians in the scene, is a recently attractive research topic in intelligent visual surveillance. However, there are still several largely unsolved problems, including how to explore the interaction between people and between people and the environment, how to automatically mine collective activities and their relationships, and how to perform efficient recognition and searching for large scale collective activity data. In this research proposal, based on visual video images, we address the following four main aspects: 1) proposing a discriminant bilinear interaction model to mine intrinsic interactions in a collective activity; 2) proposing large scale clustering algorithms to mine potential collective activities in the data and also explore their relationships; 3) developing online locality-sensitive distance learning for large scale collective activity data; 4) developing robust hash function learning models and further embedding the relationship between collective activities into the models for large scale searching. In addition, this research proposal will also explore how collective activity information and their relationships can be used to assist person re-identification, with a close connection to investigator's previous work. While advancing collective activity analysis, the proposal can also make contribution to the development of large scale machine learning algorithms.

多人交互行为分析主要是针对视频图像中与多人有关的多种交互信息进行分析和识别,是涉及公共安全问题的新兴重要课题。然而,如何挖掘多人交互行为中各种潜在的深层交互关系、如何挖掘不同交互行为之间的关联、如何面向大规模多人交互行为数据及其关联信息建模识别和搜索模型等仍有待深入研究。为此,面向大规模视频图像信息,本课题拟从如下4个主要方面展开研究:1) 发展鉴别双线性相关性学习模型以挖掘多人交互行为中内在的交互关系;2) 从大规模视频图像中挖掘潜在的多人交互行为信息及它们之间的关联信息;3) 面向大规模多人交互行为数据发展局部敏感的在线距离学习模型;4) 提出鲁棒的哈希函数学习模型,并在建模中嵌入多人交互行为之间的关联信息。此外,本研究还拟结合申请人以往的行人再标识工作,探讨研究如何利用多人交互行为的关联信息协助行人再标识。本研究旨在促进多人交互行为分析发展同时,促进相关的大规模机器学习的发展。

项目摘要

本项目研究智能视频监控下的人群行为分析及身份识别问题,主要研究个体行为、多个行人动作协同的行为分析,并结合和发展申请人以往的行人重识别(即行人重识别)的工作,探讨研究如何利用人群行为信息协助行人重识别。自2014年获准立项以来,本课题已经主要发展:1)基于机器学习的多人交互行为分析图模型,以及基于松弛回归建模的行为预测;2)针对行人重识别的瓶颈问题,提出了行人验证模型、残缺行人重识别、基于跨视角非对称聚类的无监督行人重识别和深度聚融CNN与人工特征的行人重识别,3)针对所涉及的大规模数据处理背景,提出了数个快速非线性聚类(含欧拉聚类)和搜索方法(在线哈希检索学习、多模态半监督哈希检索学习),并应用于行人重识别解决无监督重识别和快速行人重识别问题。已发表国际学术论文33篇(均为第一作者或通讯作者论文), 其中IEEE Transactions 12篇,Pattern Recognition 3篇;顶级计算机视觉国际学术会议12篇。进一步获得了国家优秀青年科学基金、国家自然科学基金委与英国皇家学会联合资助的中英人才项目“英国皇家学会牛顿高级学者基金”的支持。获广州市科学技术进步奖一等奖、广东省科学技术进步奖二等奖,并获中国计算机学会计算机视觉专委会(CCF-CV)服务贡献奖。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于SSVEP 直接脑控机器人方向和速度研究

基于SSVEP 直接脑控机器人方向和速度研究

DOI:10.16383/j.aas.2016.c150880
发表时间:2016
2

连续视程人工晶状体植入术后残余散光对视觉质量的影响

连续视程人工晶状体植入术后残余散光对视觉质量的影响

DOI:10.3760/cma.j.cn112142-20210918-00435
发表时间:2022
3

基于局部轮廓形状特征的复杂管路结构识别方法

基于局部轮廓形状特征的复杂管路结构识别方法

DOI:10.13196/j.cims.2019.03.007
发表时间:2019
4

基于结构光视觉引导的工业机器人定位系统

基于结构光视觉引导的工业机器人定位系统

DOI:10.3788/aos201636.1015001
发表时间:2016
5

基于多尺度和注意力机制的滚动轴承故障诊断

基于多尺度和注意力机制的滚动轴承故障诊断

DOI:10.3969/j.issn.1001-0505.2022.01.022
发表时间:2022

郑伟诗的其他基金

相似国自然基金

1

视频中交互行为的自动分析与理解

批准号:61203291
批准年份:2012
负责人:裴明涛
学科分类:F0604
资助金额:25.00
项目类别:青年科学基金项目
2

视频中交互行为的表示与理解方法

批准号:61375044
批准年份:2013
负责人:贾云得
学科分类:F0304
资助金额:81.00
项目类别:面上项目
3

基于视觉的多人交互行为分析

批准号:60905006
批准年份:2009
负责人:梁玮
学科分类:F0604
资助金额:19.00
项目类别:青年科学基金项目
4

基于视频的多人行为分析研究

批准号:60973061
批准年份:2009
负责人:苗振江
学科分类:F0210
资助金额:31.00
项目类别:面上项目