The robot visual recognition system is indeed an online system, however nowadays, nearly all of these systems are based on offline learning with batch training, where the model cannot online update and is inefficient for retraining of big data. The state-of-the-art online metric learning models cannot guarantee converge, surfer over-fitting problem and the accuracy is low and fluctuated with iterations. For scene classification, this proposal intends to propose an effective online learning theory and establish a unified online learning framework. For modeling, depending on the low rank property of real data, we design a convex optimization model for online metric learning, which can decrease the complexity of the model and overcome over-fitting; and we pursuit the expectation of the model to guarantee the converge and use the stochastic optimization to achieve an efficient solution. For scene representation, we fuse the spatio-temporal cues and design an adaptive feature selection model based on group sparsity theory. Then, a new bilinear similarity graph is designed to make an accurate prediction and model updating, and we derive a close-form solution for online label propagation. Depending on this research, we will solve the overfitting and non-converge issues for online metric learning algorithm in theory, and achieve online learning for big data. This research will significantly promote the robot online cognitive and its practical application.
机器人视觉识别系统本质上应是在线系统,但目前几乎均采用批处理离线学习方式,其问题是模型不能在线更新,且存在大样本重新训练效率低下等问题。已有在线度量学习模型,存在收敛性无法保证及过拟合问题,准确率较低且随迭代波动。 本项目申请针对场景分类,拟提出有效的在线学习理论方法,建立统一的在线学习框架。模型上,根据实际数据的低秩特性,构建凸优化在线度量学习模型,降低模型复杂度并避免过拟合问题;同时将模型统计期望作为优化目标,以保证解的收敛性,并用随机优化实现快速求解。表达上,融合数据时空信息,设计基于群稀疏性理论的自适应特征选择算法,从而有效剔除冗余特征。在此基础上,定义新的双线性相似图,推导出在线标签传播闭式解,实现准确预测和模型更新。通过本研究,我们将在理论上解决目前在线度量学习算法的过拟合和收敛性问题,实现大样本在线学习。本课题的研究成果将对机器人在线认知研究及其实际应用具有重要推进作用。
机器人视觉感知和认知系统是衡量机器人自主行为能力的关键,其核心是以人工智能技术为核心的理论、模型和算法。传统基于批处理离线学习的算法,如深度学习,需要长时间大样本密集计算。而机器人是一个典型的在线学习系统,需要具有高效的在线学习能力以应对场景和作业对象的在线变化。因此,本项目意在提出一种有效的在线学习理论方法,建立统一的在线学习框架,以提高机器人在线自主学习能力。. 在理论研究方面,我们开展了1)在线相似度度量学习研究,利用实际数据的内在低秩特性,设计了一种基于Max范数的在线低秩度量学习算法,降低模型复杂度为O(n^2),可大幅提高算法执行效率;2)为避免过拟合问题,我们提出基于群稀疏性和低秩约束的在线度量学习模型,可同时剔除秩冗余和特征冗余,并实现特征选择;3)为充分利用未标注样本实现在线标签传播,我们利用半监督学习思想,推导出在线标签传播的闭式解,实现模型的鲁棒实时更新。. 在应用方面,我们也注重将理论结合实际解决实际问题,开展了如下工作:1)在机器人场景理解方面,我们利用在线度量学习实现室内外场景的在线分类;同时提出基于自适应字典选择模型,可实现连续视频的自动语义浓缩;2)在机器人自动目标跟踪方面,我们的在线学习模型提高了系统对目标自身属性(如纹理、形状等)在线变化的鲁棒性;3)在机器人辅助病灶诊断方面,我们提出一种基于弱标注大数据的在线病灶识别算法,一定程度克服了传统监督学习方法需要大量精细人工标注样本进行模型训练的问题,可直接利用医学诊断报告进行自学习。. 上述理论成果已经发表多篇高水平论文,包括IEEE Transaction论文5篇和模式识别知名期刊Pattern Recognition论文2篇,参与出版Springer 专著一部,申请发明专利5项,获得包括辽宁省科技进步二等奖在内的奖励多项。同时申请人获得国家自然科学基金优秀青年基金的连续支持。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于SSVEP 直接脑控机器人方向和速度研究
低轨卫星通信信道分配策略
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
惯性约束聚变内爆中基于多块结构网格的高效辐射扩散并行算法
Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究
服务机器人广域环境感知和场景认知理论及应用
基于视觉感知和深度学习的机器人鲁棒抓取研究
面向智能机器人感知的三维场景重建与分析
智能机器人的环境感知和认知决策自学习方法研究