连续时间马氏决策过程的最优停止、受约束平均最优以及有限状态逼近问题

基本信息
批准号:11801080
项目类别:青年科学基金项目
资助金额:22.00
负责人:张文钊
学科分类:
依托单位:福州大学
批准年份:2018
结题年份:2021
起止时间:2019-01-01 - 2021-12-31
项目状态: 已结题
项目参与者:王彬福,浦佳祺,章明亮
关键词:
有限状态逼近最优策略风险灵敏马氏决策过程Q过程
结项摘要

This proposal focuses on the optimal stopping, constrained average optimal and finite-state approximation problems for the risk-sensitive continuous-time Markov decision processes. The motivation of this proposal is based on the following facts: 1)Risk-sensitive continuous-time Markov decision processes can reflect the deciders’ attitudes towards the risk by introducing the risk-sensitivity coefficient, which have great wide applications in finance, management science and so on; 2) the existing literature of the stopping optimal problem is limited in the case that the state space is denumerable and the reward function only depends on the terminal state; 3) the existing literature only consider the unconstrained optimality problems and the method for risk- neutral case can’t adapt to the risk-sensitive case because of the nonlinearity of risk sensitivity criterion; 4)finite-state approximation methods devotes to convert complicated model to some simple and computable model, which can break the limit that the optimal value and optimal policies can’t be solved when the state space is not finite. For the risk-sensitive continuous-time Markov decision processes, this proposal intends to achieve the following objects: 1)For the optimal stopping and constrained average optimal problems with general Borel space, we plant to give the optimal stopping condition for the optimal stopping problem and the existence condition and properties of optimal policies for the constrained average optimal problem, as well as the algorithms; 2) we will establish the finite-state approximation method and give the error estimation of optimal value for the discounted model.

本项目研究风险灵敏意义下的连续时间马氏决策过程最优停止、受约束平均最优以及有限状态逼近问题。该项目的提出基于下列事实:1)风险灵敏的马氏决策过程通过引入风险灵敏因子可以反映决策者对风险的偏好程度,在金融、管理科学等领域具有广泛的应用背景;2)关于最优停止问题,现有文献局限于状态空间可数且效用函数只依赖于终止状态的情形;3)现有文献只针对非约束最优问题。同时由于风险灵敏准则的非线性特征,风险中性情形下的方法无法适用; 4)有限状态逼近方法将复杂模型转换为简单的可求解模型。可以解决状态空间非有限时,最优值和最优策略无法计算的局限性。针对风险灵敏的连续时间马氏决策过程,本项目拟实现如下目标:1)对于一般Borel状态空间的最优停止、受约束平均最优问题,我们将给出相应的最优停止条件,最优策略的存在性条件、性质及其计算方法;2)对于折扣模型,建立有限状态逼近方法,给出最优值函数的误差估计式。

项目摘要

马氏决策过程以及随机对策可以描述具有概率转移机制的动态模型,并广泛应用于金融、管理科学等领域。本项目发展了连续时间马氏决策过程的有限状态逼近方法,证明了约束平均最优策略的存在性。对离散时间以及连续时间状态过程独立情形下的随机对策,研究其约束平均最优问题。我们得到了如下结果:1)对连续时间马氏决策过程,证明了有限状态模型的约束平均最优策略的聚点为可数状态模型的约束平均最优策略,从而得到了约束平均最优策略的存在性。同时给出了有限状态模型和可数状态模型最优值函数的误差估计。从而将复杂模型的优化问题转化成简单模型的优化问题来求解;2)对离散时间随机对策的受约束平均模型,给出了Nash均衡点新的存在性条件以及Nash均衡点的数学规划表示;3)对结构更加复杂的连续时间随机对策的受约束平均模型,同样给出了Nash均衡点新的存在性条件以及Nash均衡点的数学规划表示。该数学规划的建立给出了Nash均衡点更加直观的刻画。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素

DOI:10.3969/j.issn.1673-1689.2021.10.004
发表时间:2021
2

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

正交异性钢桥面板纵肋-面板疲劳开裂的CFRP加固研究

DOI:10.19713/j.cnki.43-1423/u.t20201185
发表时间:2021
3

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
4

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019
5

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

小跨高比钢板- 混凝土组合连梁抗剪承载力计算方法研究

DOI:10.19701/j.jzjg.2015.15.012
发表时间:2015

张文钊的其他基金

相似国自然基金

1

连续时间马氏决策过程受约束问题的研究

批准号:11526092
批准年份:2015
负责人:魏清达
学科分类:A0405
资助金额:3.00
项目类别:数学天元基金项目
2

一般状态连续时间马氏过程最优控制的研究

批准号:10271120
批准年份:2002
负责人:郭先平
学科分类:A0209
资助金额:20.00
项目类别:面上项目
3

连续时间马氏决策过程均值-方差优化问题的研究

批准号:11201182
批准年份:2012
负责人:叶柳儿
学科分类:A0209
资助金额:22.00
项目类别:青年科学基金项目
4

风险灵敏的连续时间马氏决策过程

批准号:61773411
批准年份:2017
负责人:郭先平
学科分类:F0301
资助金额:67.00
项目类别:面上项目