实时深度图像人手位姿估计方法及其稳定性分析

基本信息
批准号:61876170
项目类别:面上项目
资助金额:62.00
负责人:徐迟
学科分类:
依托单位:中国地质大学(武汉)
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:李勇波,李玉清,关泽彪,洪鑫,蔡文迪,赵涛,饶靖
关键词:
手势识别人手位姿估计人手跟踪深度图像歧义位姿
结项摘要

The project aims at real-time hand pose estimation from depth images which is a new research topic that has emerged in recent 7 years. The bottleneck of this technology is instability problem because of the complex structure of human hand and the ambiguous pose occurred. Firstly, we investigate how the ambiguous pose and depth image noise affect the stability of pose estimation. Secondly, we analyze the feasible conditions for steady estimating hand pose, and a new pose estimation method will be developed based on Lie group manifold theory and deep learning framework. Finally, the proposed method will be verified in an Intelligent lower limb rehabilitation robot application. The outcome of this research will help machine understand human hand actions and intentions as human does, which could be wildly applied in many fields such as medical care, intelligent robot, and assistance driving. Therefore, it has important theoretic and practical value.

实时深度图像人手位姿估计是近年来发展起来的一个新的计算机视觉方向,所指的是实时的从单幅深度图像(或序列图像)中识别人手并估计人手的全自由度三维位姿。由于人手结构复杂、关节自遮挡严重,常出现歧义位姿现象,位姿估计的稳定性难以保证。本项目针对人手位姿估计的稳定性问题,首先,探讨深度图像噪音与歧义位姿现象对位姿估计稳定性的影响规律及失稳机制;然后,分析稳定求解人手位姿的可行条件,研究在深度学习框架下结合李群流形理论提出新的人手位姿估计方法,提高位姿估计的稳定性;最后,在面向智能下肢康复机器人的人机交互应用中验证本项目所提出的方法的有效性。研究成果可以有效的帮助机器像人一样用视觉方式感知人手的动作并理解用户的意图,在医疗卫生、智能机器人、辅助驾驶等领域有广阔的应用前景,具有重要的理论意义与应用价值。

项目摘要

本项目针对实时深度图像人手位姿估计问题,从深度图像噪音与歧义位姿现象这两个关键点入手对人手位姿估计的稳定性展开研究。首先,研究了深度相机图像噪音形成的物理机制,通过大量有噪音的真实人手深度图像和无噪音的合成人手学习点云失真的规律,实现低成本合成大量带有随机噪音的人手深度图像;然后,分析了歧义位姿失稳现象,构建了基于Transformer的深度模型预测歧义关节点位置的概率分布,并根据所求得概率分布的特点判定是否存在歧义位姿;接着,结合深度学习框架并利用物理运动的时空连续性,设计了能求解单幅图像位姿概率分布和序列图像连续动态位姿的方法;最后,搭建了面向智能下肢康复的人机交互实验平台,对所提出方法的有效性进行了验证。本项目取得了一系列研究成果,共发表学术论文15篇,其中SCI收录JCR二区论文5篇,EI收录国际会议论文10篇,获得发明专利3项,软件著作权1项,培养了2名博士研究生,10名硕士研究生,其中6名已经获得硕士学位。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
2

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022
3

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

居住环境多维剥夺的地理识别及类型划分——以郑州主城区为例

DOI:10.11821/dlyj201810008
发表时间:2018
4

基于细粒度词表示的命名实体识别研究

基于细粒度词表示的命名实体识别研究

DOI:10.3969/j.issn.1003-0077.2018.11.009
发表时间:2018
5

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

基于协同表示的图嵌入鉴别分析在人脸识别中的应用

DOI:10.3724/sp.j.1089.2022.19009
发表时间:2022

徐迟的其他基金

相似国自然基金

1

多视觉-惯性单元实时高精度连续位姿估计方法研究

批准号:61173123
批准年份:2011
负责人:刘勇
学科分类:F0209
资助金额:61.00
项目类别:面上项目
2

基于点云深度学习的光机组件三维位姿估计与跟踪

批准号:61771471
批准年份:2017
负责人:黎万义
学科分类:F0113
资助金额:62.00
项目类别:面上项目
3

MRF模型的车载全景视觉位姿估计最优化方法研究

批准号:41501504
批准年份:2015
负责人:张正鹏
学科分类:D0115
资助金额:20.00
项目类别:青年科学基金项目
4

舰载无人直升机自主着舰环境感知与位姿估计方法研究

批准号:61773395
批准年份:2017
负责人:石章松
学科分类:F0309
资助金额:16.00
项目类别:面上项目