首次研究首达目标总报酬随机序最优模型,在理论分析与算法方面取得重要进展,同行认为在MDP中提出了一种重要的新的优化问题;对折扣报酬的概率准则与最小风险模型提出了一个新的模型框架、解决了多年来未解决的难题:最优策略的存在性及其它基本问题,使该模型取得实质性进展;对多目标平均报酬百分位模型,完满解决了两个公开问题;将模糊准则引入MDP,建立了该准则的一般框架,聚得系列结果;首次给出基于Hopfield神经网络的寻优算法;证明了首达目标总报酬的分布函数由它的有限阶矩唯一确定的重要结论;对已有的随机神经网络模型作了实质上的推广。以上成果有重要的意义与广泛的应用背景,部分成果在国内外同类研究中是领先的。
{{i.achievement_title}}
数据更新时间:2023-05-31
基于分形L系统的水稻根系建模方法研究
DeoR家族转录因子PsrB调控黏质沙雷氏菌合成灵菌红素
黄河流域水资源利用时空演变特征及驱动要素
拥堵路网交通流均衡分配模型
2016年夏秋季南极布兰斯菲尔德海峡威氏棘冰鱼脂肪酸组成及其食性指示研究
分枝马氏过程的若干研究
马氏决策过程的理论与应用
风险灵敏的连续时间马氏决策过程
马氏过程边界理论的若干问题