研究用于求解大规模和连续状态/行为空间序贯决策优化问题的增强学习泛化方法,并将研砍晒糜谝贫魅寺肪豆婊筒蝗范ɑ肪持械淖匝暗己健1究翁獾难芯吭诶砺凵辖俳銮垦胺夯侍獾慕饩觯栽銮垦霸诟丛佑呕涂刂莆侍庵械挠τ镁哂兄匾庖濉T诠こ淌导希杂谝贫魅讼低吃诟丛印⒉蝗范ɑ肪持刑岣咦灾鞯己侥芰τ兄匾饔谩
{{i.achievement_title}}
数据更新时间:2023-05-31
低轨卫星通信信道分配策略
基于公众情感倾向的主题公园评价研究——以哈尔滨市伏尔加庄园为例
面向云工作流安全的任务调度方法
基于协同表示的图嵌入鉴别分析在人脸识别中的应用
TGF-β1-Smad2/3信号转导通路在百草枯中毒致肺纤维化中的作用
结构化增强学习及其在虚拟人运动规划中的应用
基于手绘语义地图的室内泛在感知网络下移动机器人视觉交互导航研究
策略搜索强化学习方法及在移动机器人运动控制中的应用
动力学对策问题学习与预测算法及其在导航制导中的应用