基于虚拟个体行为逼近的多机器人自学习决策与协调控制一体化

基本信息

批准号：61873248

项目类别：面上项目

资助金额：63.00

负责人：陈鑫

学科分类：

依托单位：中国地质大学（武汉）

批准年份：2018

结题年份：2022

起止时间：2019-01-01 - 2022-12-31

项目状态：已结题

项目参与者：徐迟,丁敏,王巍,符浩,王婕,李璐,张浩阳

关键词：

知识迁移评价执行结构一致性分布式策略学习模型参考自适应控制

结项摘要

To tackle the complex conditions in flexible task, such as uncertain environment, variable load, and unpredictable disturbance, the project mainly investigates the integration of dynamic decision-making and coordination control among multiple robots. A multi-layer distributed decision-making–control architecture for multiple agents will be developed, in which a virtual agent is designed to regulate individual behavior, so that based on it, the iterative cooperative strategy learning and the finite-time consensus control work together smoothly. To meet the requirements of cooperative decision when a flexible task is being executed, a knowledge transfer-based continuous space distributed learning will be studied to ensure efficient self-learning decision-making of multi-robot under an unknown environment. With the conditions of unknown dynamics characteristics resulting from variable load, and unpredictable disturbance taken into account, a robust adaptive dynamic programming-based model reference adaptive control method will be studied, which makes an individual robot enable to approximate a predetermined reference behavior model adaptively, even whose dynamic model is unknown in priori. Then this reference behavior model serves as a dynamic model of a virtual agent, based on which a finite-time consensus protocol will be designed. Finally, a simulation system and a multiple manipulators experimental system will be constructed, in order to test the integration of self-learning decision-making and coordinate control, from the aspects of effectiveness and engineering applicability. The project has important theoretical significance and application prospect for providing a new solution to design intelligent decision-making and control system for multi-robot systems, which are applied for the flexible tasks of intelligent manufacturing.

针对柔性任务具有的未知环境、变负载和未知扰动等复杂情况，本项目主要解决多机器人动态决策与多个体协调控制相融合的问题。研究构建多个体的分层分布式决策—控制架构，建立规范个体行为的虚拟个体，并基于其实现迭代合作策略学习和有限连续时间一致性控制的融合。对执行柔性任务时多机器人协同决策需求，研究结合知识迁移的连续空间分布式策略学习方法，保证在未知环境下多机器人高效自学习决策；考虑机器人变负载导致动态特征未知及未知扰动情况，研究基于鲁棒自适应动态规划的模型参考自适应控制方法，实现未知动态个体对理想参考行为模型的自适应逼近；以参考行为模型为虚拟个体的动态模型，设计有限时间一致性协议，实现与迭代策略学习的结合。最后，建立多机械臂仿真实验平台，验证自学习决策与协调控制一体化方法的有效性与工程适用性。本项目将为智能制造领域面向柔性任务的多机器人系统提供新的智能决策和控制设计方案，具有重要理论意义和应用前景。

项目摘要

本项目为实现多机器人在变负载和未知扰动环境下的策略实时优化与协调控制，构建了一种结合合作策略优化与一致性控制的优化模型，以虚拟个体的参考行为模型为桥梁，形成由合作策略学习、一致性控制、MRAC构成的分层决策-控制架构。首先，针对连续空间中多机器人系统的合作策略学习问题，提出基于连续空间合作策略搜索的分布式同时学习方法；同时，研究基于高斯核函数的双阶段值迭代算法，解决连续空间合作策略学习的泛化问题；针对多机器人系统从头学习效率低的问题，将一种知识迁移机制用于多机器人系统的智能决策和自学习控制中。其次，为实现个体动态未知和随机环境下异构多智能体系统的一致性控制，构造确定性参考行为模型，提出基于自适应动态规划的模型参考自适应控制方法，实现智能体行为对参考行为模型的逼近；针对鲁棒控制对精确数学模型依赖性的问题，提出了一种鲁棒ADP方法，实现了在变负载、未知扰动条件下的高品质高精度MRAC。此外，考虑到离散时间分布式策略学习与多机器人期望内模式跟踪控制的配合，需要实现有限时间内一致性控制才能保证合作策略学习的有效进行，首先针对具有随机扰动的未知环境下的线性系统的最优跟踪控制问题，研究了基于值迭代的最优跟踪控制方法；然后针对异构非线性多智能体系统，提出了基于参考模型的分布式一致性控制方法。通过搭建针对多机器人系统的仿真系统及实际系统实验平台，验证了所提方法的可行性和高效性。本项目的研究为复杂未知环境下的多机器人系统提供了一种切实可行的合作策略优化与一致性控制方法，有力促进了协作式多机器人系统在复杂任务与未知环境下的应用，具有重要的理论意义和工程应用价值。

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.1051/jnwpu/20213920292

发表时间：2021

DOI：10.13197/j.eeev.2019.05.95.fuwq.009

发表时间：2019

DOI：10.6041/j.issn.1000-1298.2022.07.022

发表时间：2022

DOI：

发表时间：2021

DOI：10.16383/j.aas.c180673

发表时间：2021

陈鑫的其他基金

批准号：81601606

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

批准号：51175214

批准年份：2011

资助金额：60.00

项目类别：面上项目

批准号：81802405

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：51609244

批准年份：2016

资助金额：21.00

项目类别：青年科学基金项目

批准号：81502363

批准年份：2015

资助金额：18.00

项目类别：青年科学基金项目

批准号：61300016

批准年份：2013

资助金额：23.00

项目类别：青年科学基金项目

批准号：31501115

批准年份：2015

资助金额：21.00

项目类别：青年科学基金项目

批准号：61376016

批准年份：2013

资助金额：82.00

项目类别：面上项目

批准号：81802494

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：20704042

批准年份：2007

资助金额：20.00

项目类别：青年科学基金项目

批准号：81370259

批准年份：2013

资助金额：70.00

项目类别：面上项目

批准号：11002089

批准年份：2010

资助金额：22.00

项目类别：青年科学基金项目

批准号：51408389

批准年份：2014

资助金额：25.00

项目类别：青年科学基金项目

批准号：81902106

批准年份：2019

资助金额：21.00

项目类别：青年科学基金项目

批准号：81601469

批准年份：2016

资助金额：17.00

项目类别：青年科学基金项目

批准号：11904273

批准年份：2019

资助金额：27.00

项目类别：青年科学基金项目

批准号：51602270

批准年份：2016

资助金额：20.00

项目类别：青年科学基金项目

批准号：61106029

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：51106178

批准年份：2011

资助金额：25.00

项目类别：青年科学基金项目

批准号：81200261

批准年份：2012

资助金额：24.00

项目类别：青年科学基金项目

批准号：81870193

批准年份：2018

资助金额：57.00

项目类别：面上项目

批准号：81801303

批准年份：2018

资助金额：21.00

项目类别：青年科学基金项目

批准号：81070180

批准年份：2010

资助金额：32.00

项目类别：面上项目

批准号：61473316

批准年份：2014

资助金额：82.00

项目类别：面上项目

批准号：61074058

批准年份：2010

资助金额：36.00

项目类别：面上项目

批准号：31871386

批准年份：2018

资助金额：60.00

项目类别：面上项目

批准号：11372185

批准年份：2013

资助金额：90.00

项目类别：面上项目

相似国自然基金

基于三维虚拟危险势能图的道路车辆紧急避让驾驶行为决策与G矢量运动协调控制研究

批准号：61304189

批准年份：2013

负责人：冀杰

学科分类：F0302

资助金额：24.00

项目类别：青年科学基金项目

复杂空间曲线型D类焊缝的多机器人协调运动轨迹生成及其自学习控制

批准号：51875415

批准年份：2018

负责人：陈绪兵

学科分类：E0510

资助金额：59.00

项目类别：面上项目

多机器人协调控制

批准号：69145001

批准年份：1991

负责人：蒋静坪

学科分类：F0306

资助金额：3.00

项目类别：专项基金项目

基于多智能体协调的机器人系统控制

批准号：69985002

批准年份：1999

负责人：洪炳熔

学科分类：F0309

资助金额：18.00

项目类别：专项基金项目

基于虚拟个体行为逼近的多机器人自学习决策与协调控制一体化

{{i.achievement_title}}

暂无此项成果

其他相关文献

一种基于多层设计空间缩减策略的近似高维优化方法

基于被动变阻尼装置高层结构风振控制效果对比分析

基于改进LinkNet的寒旱区遥感图像河流识别方法

长链基因间非编码RNA 00681竞争性结合miR-16促进黑素瘤细胞侵袭和迁移

二维FM系统的同时故障检测与控制

陈鑫的其他基金

肿瘤靶向纳米载体-生物降解水凝胶响应性转变体系的构筑、调控及其在肿瘤治疗中的应用研究

基于柔性仿生车外造型的汽车内部气动噪声分析与控制方法研究

抗凝血酶III抑制肝癌的作用及其机制

非对称歪斜波作用下的层移输沙特性研究

miR-429靶向调节NF-κB信号通路调控人神经母细胞瘤增殖和转移机制的研究

带等级约束的半在线调度问题模型与算法研究

基于超高分辨率显微成像技术的程序性细胞坏死机制研究

一维纳米结构分段集成红外与可见双量子点的多光谱光电转换与表界面研究

环状RNA LIMD1作为海绵体吸附miR-372抑制胶质瘤进展的机制研究

量子点组装和单量子点纳米阵列构筑的研究

CARD6在心肌肥厚中的作用及机制研究

带空泡出水物体与非线性自由面相互作用的研究

自立式薄壁钢管结构耦合风致疲劳损伤评估与TMD控制

中缅边境新HIV-1重组型CRF83_cpx传播和流行的进化生物学研究

基于影像组学的胶质母细胞瘤MGMT基因启动子甲基化定量研究

非z切铌酸锂薄膜光学超晶格的全光极化研究

内嵌金属富勒烯作为高效氧还原电催化剂的研究

超级动态电压调节技术下的内建速度测试系统研究

共振腔内激波聚焦起爆爆震波机理研究

阻断成纤维细胞来源的HB-EGF和BMP4逆转Barrett食管的实验研究

IKKε对心肌梗死后心肌细胞自噬与焦亡交互作用的调控及其机制研究

TERT驱动的神经元代谢重组促进突触重建缓解低灌注性脑损伤

IKK ε在动脉粥样硬化形成及内皮细胞损伤中的作用及分子机制研究

基于双时间尺度优化的多机器人策略自适应与一致性

基于合作策略自学习的多机器人系统智能协作模型

炎症小体激活引起的焦亡小体和类外泌体的性质分析以及功能初探

浅水波浪场中超空泡的流体动力特性研究

相似国自然基金