RGB-D视频序列特征的深度学习模型及在人体行为识别中的应用

基本信息
批准号:61370119
项目类别:面上项目
资助金额:73.00
负责人:孙艳丰
学科分类:
依托单位:北京工业大学
批准年份:2013
结题年份:2017
起止时间:2014-01-01 - 2017-12-31
项目状态: 已结题
项目参与者:高俊斌,唐恒亮,齐光磊,赵璐,刘洋,熊林欣,徐欢
关键词:
卷积神经网络多模态深度学习行为识别深度学习深度视频序列
结项摘要

Confronted with the meet of accuracy and robustness human action recognition, we will make a proposal about human action recognition based on deep learning theory and methods. By using RGB and depth video information, our proposal aims to overcome some essential feature representation dificulties while variations of pose, illumination and appearance feature. We discard the approach building classifiers based on complex handcrafted features computed from the raw inputs, and propose using unsupervised feature learning as a way to learn features directly from video data. This project mainly centres on the following critical issues: (1)the method of depth video image denoising and quality improvement,(2)the deep learning model of multi-level action feature based on RGB-D video information,(3)multimodal deep learning model fusing RGB and depth video information,and (4)human action recognition method with the multimodal deep learning representation model. A human action recognition computing model will be established under a complicated condition such as variations of pose and illumination. Eventually we establish a human action recognition system fusing depth and RGB video information, which validates the effectiveness of proposed theory and algorithm.

面向RGB-D视频环境下人体行为准确、鲁棒识别的应用需求,针对行为序列多光照难识别,行为外观多变化难描述,行为特征多层次难提取等核心问题,拟借助RGB、深度视频等感知信息,利用多源异构信息时空相关性和互补性,通过深度学习的理论和方法,发现并提取人体行为特征。尤其研究深度视频图像的去噪和质量提升方法;基于视频序列的人体行为特征的深度学习模型;发展融合深度视频和RGB视频信息的人体行为多模态特征的深度学习模型;建立基于深度学习表示模型的人体行为识别方法。探索人体行为识别的计算模型,解决传统人体行为特征表示手段的局限性,实现人体行为姿态、光照变化等复杂条件下人体行为的有效识别。最终实现一个原型系统:姿态、光照变化条件下融合深度、RGB视频信息的人体行为识别系统,以验证本项目提出的理论算法的有效性。

项目摘要

大部分已有的人体行为识别方法本质上利用预先定义的行为特征进行识别,并且对光照、外观变化等较敏感。本项目面向RGB-D视频,从学习多源数据的人体行为特征出发,首先搭建了面向行为分析的数据采集平台,采集并处理了多源异构行为数据;提出了RGB-D数据的张量表示,并研究了张量数据的若干降维方法,实现了RGB-D视频的降维表达;研究了RGB-D视频人体行为特征表示与分析;利用多源异构信息时空相关性和互补性,通过深度学习的理论和方法,提出了RGB-D(张量数据)视频的深度学习模型,该模型避免了传统模型中将数据向量化的过程,更好地保持其空间结构信息;提出了基于乘积流形的多模态信息的融合方法,实现RGB和深度数据的融合,同时也探讨融合深度视频和RGB视频信息的人体行为多模态特征的深度学习模型。.本项目以基于RGB-D视频的行为分析与理解中的关键基础问题为重点,以学习新的特征表示方法为目标,在研究视频特点的同时,发展新的特征表示、融合、分析理解方法。本项目的成果不仅对RGB-D视频的研究具有重要意义,而且能够发展具有一般意义的相关理论方法。.经过四年的努力,已全面完成计划的各项任务。在国际、国内期刊发表(含已录用)论文24篇,其中国际期刊论文14篇(SCI刊源12篇),国内期刊论文4篇;在本领域的主流国际会议上发表论文6篇。申请国家发明专利7项,其中授权3项。培养硕士、博士研究生7名。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于多模态信息特征融合的犯罪预测算法研究

基于多模态信息特征融合的犯罪预测算法研究

DOI:
发表时间:2018
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
4

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
5

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021

孙艳丰的其他基金

批准号:60973057
批准年份:2009
资助金额:30.00
项目类别:面上项目
批准号:61772048
批准年份:2017
资助金额:63.00
项目类别:面上项目

相似国自然基金

1

基于深层特征学习的RGB-D人体行为识别方法

批准号:61502187
批准年份:2015
负责人:肖阳
学科分类:F0210
资助金额:20.00
项目类别:青年科学基金项目
2

视频侦查中基于深度学习的人体行为识别技术研究

批准号:61862015
批准年份:2018
负责人:徐增敏
学科分类:F0210
资助金额:39.00
项目类别:地区科学基金项目
3

基于稀疏表示和字典学习的深度图像序列人体行为识别

批准号:U1504611
批准年份:2015
负责人:宋相法
学科分类:F0605
资助金额:27.00
项目类别:联合基金项目
4

面向RGB-D视频的人体动作识别研究

批准号:61202133
批准年份:2012
负责人:宋砚
学科分类:F0210
资助金额:23.00
项目类别:青年科学基金项目