基于动态规划的自学习控制与人机智能系统

基本信息
批准号:69674005
项目类别:面上项目
资助金额:10.00
负责人:吴沧浦
学科分类:
依托单位:北京理工大学
批准年份:1996
结题年份:1999
起止时间:1997-01-01 - 1999-12-31
项目状态: 已结题
项目参与者:高慧琪,王潮涌,解三明,蒋国飞,侯增广,黄健昌
关键词:
不同步动态规划人机智能系统自学习控制
结项摘要

本项目成果:在研究对象模型方面,概括了随机最优控制与马氏最优决策过程的三种应用上最重要、最普遍的模型即折扣指标、时间平均指标、最大最小指标模型。在理论与方法方面,提出了建立在严密理论基础上的处理连续状态与控制空间的离散化处理方法,使之可应用Q-学习进行自学习控制,提出了建立在严密理论基础上的强化强化学习中的状态集结法,一定程度上克服大系统自学习控制的维数灾困难,提出了强化学习与神经网络结合的新方法以提高其效能;提出了改进的Q-学习,R-学习与H-学习方法。在应用方面,通过仿真实验验证了所发展的新方法在机器人路径规划、生物工程、库存控制等宽广领域内的应用效益。对其中若干应用上重要的方法,开发了专用软件。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

基于分形L系统的水稻根系建模方法研究

基于分形L系统的水稻根系建模方法研究

DOI:10.13836/j.jjau.2020047
发表时间:2020
2

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
3

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
4

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
5

卫生系统韧性研究概况及其展望

卫生系统韧性研究概况及其展望

DOI:10.16506/j.1009-6639.2018.11.016
发表时间:2018

吴沧浦的其他基金

批准号:69234011
批准年份:1992
资助金额:30.00
项目类别:重点项目
批准号:69234010
批准年份:1992
资助金额:60.00
项目类别:重点项目
批准号:68874003
批准年份:1988
资助金额:3.80
项目类别:面上项目

相似国自然基金

1

基于自适应动态规划的多智能体系统分布式最优协同控制

批准号:61903199
批准年份:2019
负责人:张怀品
学科分类:F0301
资助金额:23.00
项目类别:青年科学基金项目
2

自学习高智能系统

批准号:68775019
批准年份:1987
负责人:赵南元
学科分类:F0307
资助金额:3.50
项目类别:面上项目
3

基于脑机接口的智能控制系统研究

批准号:61074113
批准年份:2010
负责人:王行愚
学科分类:F0301
资助金额:40.00
项目类别:面上项目
4

用规划生成系统进行智能控制

批准号:68775032
批准年份:1987
负责人:严学高
学科分类:F0306
资助金额:2.50
项目类别:面上项目