基于虚拟个体行为逼近的多机器人自学习决策与协调控制一体化

基本信息
批准号:61873248
项目类别:面上项目
资助金额:63.00
负责人:陈鑫
学科分类:
依托单位:中国地质大学(武汉)
批准年份:2018
结题年份:2022
起止时间:2019-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:徐迟,丁敏,王巍,符浩,王婕,李璐,张浩阳
关键词:
知识迁移评价执行结构一致性分布式策略学习模型参考自适应控制
结项摘要

To tackle the complex conditions in flexible task, such as uncertain environment, variable load, and unpredictable disturbance, the project mainly investigates the integration of dynamic decision-making and coordination control among multiple robots. A multi-layer distributed decision-making–control architecture for multiple agents will be developed, in which a virtual agent is designed to regulate individual behavior, so that based on it, the iterative cooperative strategy learning and the finite-time consensus control work together smoothly. To meet the requirements of cooperative decision when a flexible task is being executed, a knowledge transfer-based continuous space distributed learning will be studied to ensure efficient self-learning decision-making of multi-robot under an unknown environment. With the conditions of unknown dynamics characteristics resulting from variable load, and unpredictable disturbance taken into account, a robust adaptive dynamic programming-based model reference adaptive control method will be studied, which makes an individual robot enable to approximate a predetermined reference behavior model adaptively, even whose dynamic model is unknown in priori. Then this reference behavior model serves as a dynamic model of a virtual agent, based on which a finite-time consensus protocol will be designed. Finally, a simulation system and a multiple manipulators experimental system will be constructed, in order to test the integration of self-learning decision-making and coordinate control, from the aspects of effectiveness and engineering applicability. The project has important theoretical significance and application prospect for providing a new solution to design intelligent decision-making and control system for multi-robot systems, which are applied for the flexible tasks of intelligent manufacturing.

针对柔性任务具有的未知环境、变负载和未知扰动等复杂情况,本项目主要解决多机器人动态决策与多个体协调控制相融合的问题。研究构建多个体的分层分布式决策—控制架构,建立规范个体行为的虚拟个体,并基于其实现迭代合作策略学习和有限连续时间一致性控制的融合。对执行柔性任务时多机器人协同决策需求,研究结合知识迁移的连续空间分布式策略学习方法,保证在未知环境下多机器人高效自学习决策;考虑机器人变负载导致动态特征未知及未知扰动情况,研究基于鲁棒自适应动态规划的模型参考自适应控制方法,实现未知动态个体对理想参考行为模型的自适应逼近;以参考行为模型为虚拟个体的动态模型,设计有限时间一致性协议,实现与迭代策略学习的结合。最后,建立多机械臂仿真实验平台,验证自学习决策与协调控制一体化方法的有效性与工程适用性。本项目将为智能制造领域面向柔性任务的多机器人系统提供新的智能决策和控制设计方案,具有重要理论意义和应用前景。

项目摘要

本项目为实现多机器人在变负载和未知扰动环境下的策略实时优化与协调控制,构建了一种结合合作策略优化与一致性控制的优化模型,以虚拟个体的参考行为模型为桥梁,形成由合作策略学习、一致性控制、MRAC构成的分层决策-控制架构。首先,针对连续空间中多机器人系统的合作策略学习问题,提出基于连续空间合作策略搜索的分布式同时学习方法;同时,研究基于高斯核函数的双阶段值迭代算法,解决连续空间合作策略学习的泛化问题;针对多机器人系统从头学习效率低的问题,将一种知识迁移机制用于多机器人系统的智能决策和自学习控制中。其次,为实现个体动态未知和随机环境下异构多智能体系统的一致性控制,构造确定性参考行为模型,提出基于自适应动态规划的模型参考自适应控制方法,实现智能体行为对参考行为模型的逼近;针对鲁棒控制对精确数学模型依赖性的问题,提出了一种鲁棒ADP方法,实现了在变负载、未知扰动条件下的高品质高精度MRAC。此外,考虑到离散时间分布式策略学习与多机器人期望内模式跟踪控制的配合,需要实现有限时间内一致性控制才能保证合作策略学习的有效进行,首先针对具有随机扰动的未知环境下的线性系统的最优跟踪控制问题,研究了基于值迭代的最优跟踪控制方法;然后针对异构非线性多智能体系统,提出了基于参考模型的分布式一致性控制方法。通过搭建针对多机器人系统的仿真系统及实际系统实验平台,验证了所提方法的可行性和高效性。本项目的研究为复杂未知环境下的多机器人系统提供了一种切实可行的合作策略优化与一致性控制方法,有力促进了协作式多机器人系统在复杂任务与未知环境下的应用,具有重要的理论意义和工程应用价值。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

演化经济地理学视角下的产业结构演替与分叉研究评述

演化经济地理学视角下的产业结构演替与分叉研究评述

DOI:10.15957/j.cnki.jjdl.2016.12.031
发表时间:2016
2

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
3

中国参与全球价值链的环境效应分析

中国参与全球价值链的环境效应分析

DOI:10.12062/cpre.20181019
发表时间:2019
4

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

DOI:
发表时间:2020
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

陈鑫的其他基金

批准号:81601606
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目
批准号:51175214
批准年份:2011
资助金额:60.00
项目类别:面上项目
批准号:81802405
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:51609244
批准年份:2016
资助金额:21.00
项目类别:青年科学基金项目
批准号:81502363
批准年份:2015
资助金额:18.00
项目类别:青年科学基金项目
批准号:61300016
批准年份:2013
资助金额:23.00
项目类别:青年科学基金项目
批准号:31501115
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目
批准号:61376016
批准年份:2013
资助金额:82.00
项目类别:面上项目
批准号:81802494
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:20704042
批准年份:2007
资助金额:20.00
项目类别:青年科学基金项目
批准号:81370259
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:11002089
批准年份:2010
资助金额:22.00
项目类别:青年科学基金项目
批准号:51408389
批准年份:2014
资助金额:25.00
项目类别:青年科学基金项目
批准号:81902106
批准年份:2019
资助金额:21.00
项目类别:青年科学基金项目
批准号:81601469
批准年份:2016
资助金额:17.00
项目类别:青年科学基金项目
批准号:11904273
批准年份:2019
资助金额:27.00
项目类别:青年科学基金项目
批准号:51602270
批准年份:2016
资助金额:20.00
项目类别:青年科学基金项目
批准号:61106029
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:51106178
批准年份:2011
资助金额:25.00
项目类别:青年科学基金项目
批准号:81200261
批准年份:2012
资助金额:24.00
项目类别:青年科学基金项目
批准号:81870193
批准年份:2018
资助金额:57.00
项目类别:面上项目
批准号:81801303
批准年份:2018
资助金额:21.00
项目类别:青年科学基金项目
批准号:81070180
批准年份:2010
资助金额:32.00
项目类别:面上项目
批准号:61473316
批准年份:2014
资助金额:82.00
项目类别:面上项目
批准号:61074058
批准年份:2010
资助金额:36.00
项目类别:面上项目
批准号:31871386
批准年份:2018
资助金额:60.00
项目类别:面上项目
批准号:11372185
批准年份:2013
资助金额:90.00
项目类别:面上项目

相似国自然基金

1

基于三维虚拟危险势能图的道路车辆紧急避让驾驶行为决策与G矢量运动协调控制研究

批准号:61304189
批准年份:2013
负责人:冀杰
学科分类:F0302
资助金额:24.00
项目类别:青年科学基金项目
2

复杂空间曲线型D类焊缝的多机器人协调运动轨迹生成及其自学习控制

批准号:51875415
批准年份:2018
负责人:陈绪兵
学科分类:E0510
资助金额:59.00
项目类别:面上项目
3

多机器人协调控制

批准号:69145001
批准年份:1991
负责人:蒋静坪
学科分类:F0306
资助金额:3.00
项目类别:专项基金项目
4

基于多智能体协调的机器人系统控制

批准号:69985002
批准年份:1999
负责人:洪炳熔
学科分类:F0309
资助金额:18.00
项目类别:专项基金项目