随机系统的时间不一致最优控制

基本信息
批准号:61773222
项目类别:面上项目
资助金额:63.00
负责人:倪元华
学科分类:
依托单位:南开大学
批准年份:2017
结题年份:2021
起止时间:2018-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:孙明玮,张建磊,韩晓光,张志鹏,程赟,周蕾蕾,高娜,闫玲玲,徐梓敏
关键词:
随机线性二次最优控制平均场博弈随机最优控制时间不一致性平均场最优控制
结项摘要

Bellman optimality principle is a keystone of dynamic programming theory, by which we have the time-consistency of optimal control: the local optimality can be inferred from the global optimality. However, in reality the time-consistency of optimal control fails quite often. The reasons lie in the following three points: the non-exponential discounting in the cost functional, the nonlinear term of conditional expectation in the cost functional, and the fact that time-state initial pair enters explicitly into the controlled system. The time-inconsistency pulls down the Bellman dynamic programming principle, and thus its study is very meaningful. This project aims to the study of optimal control problems with time-inconsistency, and the content is as follows. For the linear-quadratic case, some necessary and sufficient conditions will be, respectively, presented for the existence of open-loop equilibrium control and closed-loop equilibrium strategy, and the robustness of these two time-consistent solutions will be investigated. Moreover, for the general nonlinear case, necessary conditions on the existence of open-loop equilibrium control and closed-loop equilibrium strategy will be established. Policy iteration algorithm and an adaptive-dynamic-programming-type algorithm will also be presented to construct the equilibrium strategy/control. Furthermore, apply the derived time-inconsistent stochastic control theory to practical problems (such as the economic investment decision), which will promote the solvability of some corresponding problems. The implement of this project will deeply push existing optimal control theory, which has scientific significance and practical values.

Bellman最优性原理是动态规划理论的基石,由它可得最优控制的时间一致性:总体最优可推出局部最优。然而在实践中,该时间一致性却经常丢失,且导致时间不一致性的因素有三:性能指标中的非指数折扣、性能指标中条件数学期望的非线性项、时间状态初始对显示地进入到受控系统中。时间不一致性破坏了动态规划原理,因而对它的研究具有重大意义。本项目旨在研究时间不一致随机最优控制的如下内容:(1) 对线性二次问题,分别从开环和闭环的角度建立平衡策略/控制存在的充要条件,并探讨平衡策略/控制的鲁棒性;(2) 对一般非线性问题,研究平衡策略/控制存在的必要条件,并建立构造平衡策略/控制的迭代优化算法和自适应动态规划型算法;(3) 将所得时间不一致随机控制理论应用到经济投资决策等实际问题中,以期推进相关问题的解决。本项目的实施将深度推进现有最优控制理论,具有重大的科学价值和实用价值。

项目摘要

Bellman最优性原理是动态规划理论的基石,由它可得最优控制的时间一致性:总体最优可推出局部最优。然而在实践中,该时间一致性却经常丢失,且导致时间不一致性的因素有三:性能指标中的非指数折扣、性能指标中条件数学期望的非线性项、时间状态初始对显示地进入到受控系统中。时间不一致性破坏了动态规划原理,因而对它的研究具有重大意义。本项目的主要研究内容如下:对几大类线性二次问题,完全刻画了时间一致的开环均衡控制,引入了混合均衡解这一新概念,提出了处理时间不一致最优控制问题的Nash-型虚拟博弈框架,研究了鲁棒时间不一致的最优控制问题和马氏跳变参数下的问题,对Stackelberg动态博弈引入了时间一致的开环均衡解概念等。项目负责人发表文章11篇,会议论文5篇,其中SIAM Journal on Control and Optimization上3篇(其中一篇接收待见刊),IEEE Transactions on Automatic Control上2篇,International Journal of Robust and Nonlinear Control上2篇,IEEE Transactions on Cybernetics上1篇等。且项目组成员倪元华、孙明玮、张建磊分别获批新的国家自然科学基金面上项目。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

粗颗粒土的静止土压力系数非线性分析与计算方法

粗颗粒土的静止土压力系数非线性分析与计算方法

DOI:10.16285/j.rsm.2019.1280
发表时间:2019
2

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

F_q上一类周期为2p~2的四元广义分圆序列的线性复杂度

DOI:10.11999/JEIT210095
发表时间:2021
3

Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究

Himawari-8/AHI红外光谱资料降水信号识别与反演初步应用研究

DOI:
发表时间:2020
4

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

瞬态波位移场计算方法在相控阵声场模拟中的实验验证

DOI:
发表时间:2020
5

时间序列分析与机器学习方法在预测肺结核发病趋势中的应用

时间序列分析与机器学习方法在预测肺结核发病趋势中的应用

DOI:
发表时间:2020

倪元华的其他基金

相似国自然基金

1

非齐次随机跳变系统的有限短时间最优控制问题研究

批准号:61703150
批准年份:2017
负责人:成军
学科分类:F0301
资助金额:22.00
项目类别:青年科学基金项目
2

随机最优控制问题与随机哈密顿系统

批准号:11071101
批准年份:2010
负责人:韩月才
学科分类:A0601
资助金额:32.00
项目类别:面上项目
3

有限范围随机最优控制系统的数值方法与均场倒向随机系统的最优控制问题研究

批准号:11626086
批准年份:2016
负责人:凃淑恒
学科分类:A0210
资助金额:3.00
项目类别:数学天元基金项目
4

分布参数系统和随机系统的最优控制理论

批准号:18870414
批准年份:1988
负责人:李训经
学科分类:A0601
资助金额:1.00
项目类别:面上项目