基于核的增强学习与近似动态规划方法研究

基本信息
批准号:60774076
项目类别:面上项目
资助金额:25.00
负责人:徐昕
学科分类:
依托单位:中国人民解放军国防科技大学
批准年份:2007
结题年份:2010
起止时间:2008-01-01 - 2010-12-31
项目状态: 已结题
项目参与者:吴涛,薛宏涛,曾迎生,孙振平,吕治国,陈伟,刘春明,张宏宇
关键词:
Markov决策过程核方法学习控制近似动态规划增强学习
结项摘要

增强学习(reinforcement learning)是来源于人脑自评价(adaptive critic)学习机制的一类学习控制方法,在复杂系统的优化控制方面有广泛的应用前景,并且与运筹学的近似动态规划理论密切结合,近年来成为机器学习与智能系统的研究热点。本项目针对连续空间马氏决策过程的优化控制问题,以基于核的自适应评价增强学习与近似动态规划方法为主要研究内容,重点解决:增强学习中实现连续状态与行为空间值函数逼近的核方法及其快速稀疏化算法;基于核的近似动态规划理论框架,包括基于核的启发式动态规划HDP、对偶启发式规划DHP等优化控制新方法;以及增强学习与近似动态规划中能够结合先验信息的核函数构造与模型选择理论与方法等。本项目的成果将能够有效解决现有理论方法面临的算法收敛性和提高泛化性能等挑战问题,推动增强学习与近似动态规划在实际大规模优化控制问题中的应用。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

低轨卫星通信信道分配策略

低轨卫星通信信道分配策略

DOI:10.12068/j.issn.1005-3026.2019.06.009
发表时间:2019
3

内点最大化与冗余点控制的小型无人机遥感图像配准

内点最大化与冗余点控制的小型无人机遥感图像配准

DOI:10.11834/jrs.20209060
发表时间:2020
4

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

端壁抽吸控制下攻角对压气机叶栅叶尖 泄漏流动的影响

DOI:
发表时间:2020
5

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例

DOI:
发表时间:2022

徐昕的其他基金

批准号:51705121
批准年份:2017
资助金额:25.00
项目类别:青年科学基金项目
批准号:60303012
批准年份:2003
资助金额:23.00
项目类别:青年科学基金项目
批准号:81900487
批准年份:2019
资助金额:21.00
项目类别:青年科学基金项目
批准号:10774126
批准年份:2007
资助金额:36.00
项目类别:面上项目
批准号:81370197
批准年份:2013
资助金额:70.00
项目类别:面上项目
批准号:U1564214
批准年份:2015
资助金额:228.00
项目类别:联合基金项目
批准号:29403024
批准年份:1994
资助金额:6.00
项目类别:青年科学基金项目
批准号:41875068
批准年份:2018
资助金额:62.00
项目类别:面上项目
批准号:61075072
批准年份:2010
资助金额:30.00
项目类别:面上项目
批准号:41505046
批准年份:2015
资助金额:21.00
项目类别:青年科学基金项目
批准号:21133004
批准年份:2011
资助金额:280.00
项目类别:重点项目
批准号:91027044
批准年份:2010
资助金额:280.00
项目类别:重大研究计划
批准号:29973031
批准年份:1999
资助金额:13.00
项目类别:面上项目
批准号:21903083
批准年份:2019
资助金额:26.00
项目类别:青年科学基金项目

相似国自然基金

1

机器学习核方法模型选择与组合的核矩阵近似分析方法

批准号:61170019
批准年份:2011
负责人:廖士中
学科分类:F0201
资助金额:55.00
项目类别:面上项目
2

基于近似动态规划附加学习结构的电力系统控制在线自趋优理论与方法

批准号:51377092
批准年份:2013
负责人:刘锋
学科分类:E0704
资助金额:74.00
项目类别:面上项目
3

基于矩阵低秩近似的大规模核/度量学习研究

批准号:61179040
批准年份:2011
负责人:周水生
学科分类:F0113
资助金额:52.00
项目类别:面上项目
4

基于近似动态规划的复杂工业过程数据驱动双网运行优化控制方法研究

批准号:61673280
批准年份:2016
负责人:李金娜
学科分类:F0302
资助金额:61.00
项目类别:面上项目