我们对一类再制造系统的策略优化问题研究表明,虽然马氏决策过程(MDP)模型在理论上有完善的体系,在应用中却存在着一些局限性,如状态空间和策略空间大小的指数爆炸,导致经典的策略迭代和值迭代无法使用,其核心困难:策略本身复杂度过高,既无法实现,也无法对策略空间进行搜索。尽管现有方法从不同角度推进了大规模MDP问题的近似和简化求解研究,但都以寻求最优策略为目标,必然遇到共同困难:除非在很特殊条件下,一般无法保证所给问题的最优策略具有简单结构(低的描述复杂性)。这就限制了以寻求最优策略为目标的各种算法的适用范围。本项目拟从新角度,即明确将策略的描述复杂性作为约束条件来,结合序优化方法,给出大规模DEDS的策略序优化的系统性方法。这种思路优点在于:1)保证求出的策略具有相对简单的结构,一定能够在工程上实现;2)解的最优性在概率意义下可评价。本项目成果可望推进对工程中大规模策略优化问题的系统性解决。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
黄河流域水资源利用时空演变特征及驱动要素
拥堵路网交通流均衡分配模型
2016年夏秋季南极布兰斯菲尔德海峡威氏棘冰鱼脂肪酸组成及其食性指示研究
分布式事件驱动的大规模网络化离散事件动态系统策略优化
有约束的离散事件动态系统的控制与优化
多尺度网络化离散事件动态系统策略优化
离散事件动态系统的研究