动态交叉销售是电子商务中的一种个性化营销手段,其决策目标是要既满足客户个性化需求又能使电子商务零售企业获得最大收益;计算复杂性和决策实时性是问题的难点。对此,课题提出利用Q学习技术,这一模拟仿真环境下的随机优化技术,来实现动态交叉销售的实时决策。课题首先研究基于状态转移的客户在线行为模拟方法,在此基础上构建用于学习训练的仿真环境。其次,针对在巨空间里Q学习过程无法在可接受的时间里收敛的问题,课题采用两种方法来提高Q学习算法的计算效率:一个方法是用状态聚集算法对状态空间进行约简;另一种方法是利用前期知识来指导Q学习过程,使接受训练的智能代理避免模拟测试那些根本没有希望成为最优解的决策选项,从而加快学习速度。由于与决策相关的知识种类很多,课题将研究出一种基于多知识融合的Q学习算法,从而为动态交叉销售的实时决策提供可行的理论方法。
{{i.achievement_title}}
数据更新时间:2023-05-31
结直肠癌免疫治疗的多模态影像及分子影像评估
智能煤矿建设路线与工程实践
现代优化理论与应用
Identification and Antioxidant Activity of a Novel Peptide from Baijiu
近红外光响应液晶弹性体
交叉销售产品的库存补货决策与报童博弈问题研究
基于交叉销售的竞争供应链融资决策与协调机制研究
面向实时辅助作战决策的动态数据驱动仿真方法研究
制造商入侵和零售商动态销售策略下的推拉式契约研究