基于灵敏度分析的可列状态Markov决策过程的理论研究

基本信息
批准号:10926138
项目类别:数学天元基金项目
资助金额:4.00
负责人:张俊玉
学科分类:
依托单位:中山大学
批准年份:2009
结题年份:2010
起止时间:2010-01-01 - 2010-12-31
项目状态: 已结题
项目参与者:黄永辉,叶柳儿
关键词:
随机系统最优化Markov决策过程灵敏度分析
结项摘要

Markov系统的性能优化理论是处理和解决很多理论领域(运筹学、控制理论、计算科学、经济学、生物学、通讯网络、金融和排队理论等)和实际应用系统(通讯(Internet和无线通讯)、生产制造系统、服务管理、金融保险和物流管理等)中的性能评价和优化控制问题的一个非常重要的理论基础。对离散时间有限状态多链的Markov决策过程,从灵敏度分析的角度,对各种的优化准则(平均准则,bias准则,nth-bias准则等),我们得到了非常完整的一套理论结果。本项目的研究内容是同样用灵敏度分析作为工具来处理可列状态Markov系统的性能优化问题。基于灵敏度分析的方法有很多优点,它可以解决传统的Markov决策过程解决不了的一些问题,例如行动选择不独立于状态。这种理论还可以把包括扰动分析,Markov决策过程,随机控制,强化学习等不同的优化理论放在统一的框架之下。

项目摘要

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

EBPR工艺运行效果的主要影响因素及研究现状

EBPR工艺运行效果的主要影响因素及研究现状

DOI:10.16796/j.cnki.1000-3770.2022.03.003
发表时间:2022
2

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

多能耦合三相不平衡主动配电网与输电网交互随机模糊潮流方法

DOI:10.13334/j.0258-8013.pcsee.190276
发表时间:2020
3

一种基于多层设计空间缩减策略的近似高维优化方法

一种基于多层设计空间缩减策略的近似高维优化方法

DOI:10.1051/jnwpu/20213920292
发表时间:2021
4

复杂系统科学研究进展

复杂系统科学研究进展

DOI:10.12202/j.0476-0301.2022178
发表时间:2022
5

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

基于LS-SVM香梨可溶性糖的近红外光谱快速检测

DOI:
发表时间:

张俊玉的其他基金

批准号:61004037
批准年份:2010
资助金额:19.00
项目类别:青年科学基金项目
批准号:61673019
批准年份:2016
资助金额:49.00
项目类别:面上项目

相似国自然基金

1

半Markov决策过程基于灵敏度优化及其应用

批准号:61004036
批准年份:2010
负责人:李衍杰
学科分类:F0301
资助金额:20.00
项目类别:青年科学基金项目
2

可列状态Markov系统性能优化的理论研究及通信网络中的应用

批准号:61004037
批准年份:2010
负责人:张俊玉
学科分类:F0301
资助金额:19.00
项目类别:青年科学基金项目
3

隐Markov过程的性能灵敏度分析与优化

批准号:60574065
批准年份:2005
负责人:殷保群
学科分类:F0301
资助金额:23.00
项目类别:面上项目
4

基于Markov决策分析的中风恢复期的比较效益研究

批准号:81574057
批准年份:2015
负责人:马睿杰
学科分类:H3118
资助金额:50.00
项目类别:面上项目