首次研究首达目标总报酬随机序最优模型,在理论分析与算法方面取得重要进展,同行认为在MDP中提出了一种重要的新的优化问题;对折扣报酬的概率准则与最小风险模型提出了一个新的模型框架、解决了多年来未解决的难题:最优策略的存在性及其它基本问题,使该模型取得实质性进展;对多目标平均报酬百分位模型,完满解决了两个公开问题;将模糊准则引入MDP,建立了该准则的一般框架,聚得系列结果;首次给出基于Hopfield神经网络的寻优算法;证明了首达目标总报酬的分布函数由它的有限阶矩唯一确定的重要结论;对已有的随机神经网络模型作了实质上的推广。以上成果有重要的意义与广泛的应用背景,部分成果在国内外同类研究中是领先的。
{{i.achievement_title}}
数据更新时间:2023-05-31
妊娠对雌性大鼠冷防御性肩胛间区棕色脂肪组织产热的影响及其机制
中温固体氧化物燃料电池复合阴极材料LaBiMn_2O_6-Sm_(0.2)Ce_(0.8)O_(1.9)的制备与电化学性质
非牛顿流体剪切稀化特性的分子动力学模拟
组蛋白去乙酰化酶在变应性鼻炎鼻黏膜上皮中的表达研究
血管内皮细胞线粒体动力学相关功能与心血管疾病关系的研究进展
炼钢过程控制中混合神经网络模型的研究
聚脲合成反应速度的控制与性能研究
碳热-电化学还原方法直接炼钢的基础研究
Fe3C还原动力学与反应速度控制研究