基于深度学习的时序3D深度图动作语义理解

基本信息

批准号：61301299

项目类别：青年科学基金项目

资助金额：24.00

负责人：季怡

学科分类：

依托单位：苏州大学

批准年份：2013

结题年份：2016

起止时间：2014-01-01 - 2016-12-31

项目状态：已结题

项目参与者：朱香卫,朱斐,蒋德茂,罗晨,谢飞,林卉,眭昊天

关键词：

图像行为分析深度图深度学习机器视觉

结项摘要

Based on color,shape or depth information from two eyes, human visual system obtains the abstract understanding of object and its activity through the analysis process of brains. Machine learning can immitate this process and occupy an important role in intelligent surveillance, human-machine ineraction and video analysis. This project propose to combine depth images with traditional video data and use deep learning to imitate the multi-layer neural network of human brain to understand the human behavior in a long hybrid sequence. The research topics and novelties are: 1) using deep belief netword to realize the process of unsuperviored learning; 2) combine traditional colorful video data and 3D depth image in a competitional netword to immitate the visual perception of human brains. 3) for input sequences of hybrid media, use multi-layer self-taughter netword to hybrid, detect cut, abtract concepts and recognition. Based on this precess of perception, recognition and memory, this system can not only improve the learning ability and recognition skill in computer vision, but also can be extended to broader areas such as touch or hearing.

人类视觉系统基于眼睛获得的色彩，形状以及深度等信息,通过人脑的分析来获得对物体及动作的抽象语义。而通过机器学习来模拟这一过程对于智能监控，人机交互，视频检索等方面有重要的作用和意义。为此，本项目提出利用深度图和传统视频数据相结合，并使用深度学习来模拟人脑的多层神经元传递过程来实现对于人体动作不断变化过程中的动态语义理解。研究内容及创新点体现在：1）用深度信念网实现对人体姿态从底层特征到抽象认知的多层无监督学习过程 2）将传统彩色视频数据和立体深度数据结合来构成多源竞争网络来模拟大脑皮层的视觉感知 3）通过对输入流在时间序列上的多层自学网络来模拟神经系统对于人体行为获得，分段，抽象，识别和理解的逐步认知过程。这一基于感知，识别，记忆过程的系统不但可以提供机器视觉上高效的学习机制和识别能力，还可以进一步扩展及结合听觉，触觉等等多方面信道。

项目摘要

人类视觉系统基于眼睛获得的色彩，形状以及深度等信息,通过人脑的分析来获得对物体及动作的抽象语义。而通过机器学习来模拟这一过程对于智能监控，人机交互，视频检索等方面有重要的作用和意义。为此，本项目提出利用深度图和传统视频数据相结合，并使用时空特征抽取，视频流主题时序变化，以及多层信念网来模拟人脑的多层神经元传递过程来实现对于人体动作不断变化过程中的动态语义理解。.本课题结合人体动作的特征和动态流程，针对现有方法改进视觉特征的提取，学习模型的优化以及融合等实现对于动作的认知，其研究内容及创新点体现在：1）研究时序描述子作为视觉单词模拟人体视觉系统对于时空深度的感知，挖掘传统2D平面信息所无法提供的线索，并将之作为行为识别的高层语义的底层描述之一 2）多层次深度学习所得的局部和全局视觉描述提高感知系统中对于动作变化的空间估计准确度，模拟大脑多层次分析方式来获得人体姿态感知系统。 3）应用深度网络来实现对于时间轴数据的分析，结合其时序变化信息用在行为建模中，从而实现动作识别中获得，分段，抽象，识别和理解的逐步认知过程。这一基于感知，识别，记忆过程的系统不但可以提供机器视觉上高效的学习机制和识别能力，还可以进一步扩展及结合听觉，触觉等等多方面信道。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.3778/j.issn.1002-8331.1911-0012

发表时间：2020

DOI：

发表时间：

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：10.11842/wst.20190724002

发表时间：2020

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

季怡的其他基金

相似国自然基金

基于深度学习和双目视觉的深度图像估计及水下图像复原

批准号：61701463

批准年份：2017

负责人：俞智斌

学科分类：F0116

资助金额：27.50

项目类别：青年科学基金项目

基于稀疏表示和字典学习的深度图像序列人体行为识别

批准号：U1504611

批准年份：2015

负责人：宋相法

学科分类：F0605

资助金额：27.00

项目类别：联合基金项目

基于时序关联共生多媒质融合分析的视频语义理解

批准号：60603096

批准年份：2006

负责人：吴飞

学科分类：F0214

资助金额：27.00

项目类别：青年科学基金项目

基于深度学习的鲁棒口语理解研究

批准号：61573241

批准年份：2015

负责人：俞凯

学科分类：F0605

资助金额：64.00

项目类别：面上项目

基于深度学习的时序3D深度图动作语义理解

{{i.achievement_title}}

暂无此项成果

其他相关文献

针对弱边缘信息的左心室图像分割算法

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于改进LinkNet的寒旱区遥感图像河流识别方法

基于文献计量学和社会网络分析的国内高血压病中医学术团队研究

新型树启发式搜索算法的机器人路径规划

季怡的其他基金

相似国自然基金