基于动态规划的自学习控制与人机智能系统

基本信息

批准号：69674005

项目类别：面上项目

资助金额：10.00

负责人：吴沧浦

学科分类：

依托单位：北京理工大学

批准年份：1996

结题年份：1999

起止时间：1997-01-01 - 1999-12-31

项目状态：已结题

项目参与者：高慧琪,王潮涌,解三明,蒋国飞,侯增广,黄健昌

关键词：

不同步动态规划人机智能系统自学习控制

结项摘要

本项目成果：在研究对象模型方面，概括了随机最优控制与马氏最优决策过程的三种应用上最重要、最普遍的模型即折扣指标、时间平均指标、最大最小指标模型。在理论与方法方面，提出了建立在严密理论基础上的处理连续状态与控制空间的离散化处理方法，使之可应用Q-学习进行自学习控制，提出了建立在严密理论基础上的强化强化学习中的状态集结法，一定程度上克服大系统自学习控制的维数灾困难，提出了强化学习与神经网络结合的新方法以提高其效能；提出了改进的Q-学习，R-学习与H-学习方法。在应用方面，通过仿真实验验证了所发展的新方法在机器人路径规划、生物工程、库存控制等宽广领域内的应用效益。对其中若干应用上重要的方法，开发了专用软件。

项目摘要

项目成果

DOI：{{i.doi}}

发表时间：{{i.publish_year}}

暂无此项成果

数据更新时间：2023-05-31

其他相关文献

DOI：10.16796/j.cnki.1000-3770.2022.03.003

发表时间：2022

DOI：10.12202/j.0476-0301.2022178

发表时间：2022

DOI：10.13197/j.eeev.2019.05.95.fuwq.009

发表时间：2019

DOI：10.3778/j.issn.1002-8331.1903-0411

发表时间：2020

DOI：10.19328/j.cnki.2096-8655.2022.02.002

发表时间：2022

吴沧浦的其他基金

批准号：69234011

批准年份：1992

资助金额：30.00

项目类别：重点项目

批准号：69234010

批准年份：1992

资助金额：60.00

项目类别：重点项目

批准号：68874003

批准年份：1988

资助金额：3.80

项目类别：面上项目

相似国自然基金

基于自适应动态规划的多智能体系统分布式最优协同控制

批准号：61903199

批准年份：2019

负责人：张怀品

学科分类：F0301

资助金额：23.00

项目类别：青年科学基金项目

自学习高智能系统

批准号：68775019

批准年份：1987

负责人：赵南元

学科分类：F0307

资助金额：3.50

项目类别：面上项目

基于脑机接口的智能控制系统研究

批准号：61074113

批准年份：2010

负责人：王行愚

学科分类：F0301

资助金额：40.00

项目类别：面上项目

用规划生成系统进行智能控制

批准号：68775032

批准年份：1987

负责人：严学高

学科分类：F0306

资助金额：2.50

项目类别：面上项目

基于动态规划的自学习控制与人机智能系统

{{i.achievement_title}}

暂无此项成果

其他相关文献

EBPR工艺运行效果的主要影响因素及研究现状

复杂系统科学研究进展

基于被动变阻尼装置高层结构风振控制效果对比分析

新型树启发式搜索算法的机器人路径规划

"多对多"模式下GEO卫星在轨加注任务规划

吴沧浦的其他基金

递阶优化理论和方法及其在农业中的应用

递阶优化理论与投入占用产出技术及其在农业中的应用

大系统最优控制的分布式算法与降维算法

相似国自然基金