基于动态决策的灾后救灾物资分配问题研究

基本信息
批准号:71901154
项目类别:青年科学基金项目
资助金额:18.00
负责人:于丽娜
学科分类:
依托单位:首都经济贸易大学
批准年份:2019
结题年份:2022
起止时间:2020-01-01 - 2022-12-31
项目状态: 已结题
项目参与者:
关键词:
强化学习救灾物资分配供应链应急管理剥夺成本动态决策
结项摘要

Resource allocation as a core of post-disaster humanitarian logistics is crucial to the safety and health of the survivors. This is a difficult and complex decision-making process in the case of time constraints and supply shortages. Three performance indicators need to be considered: efficiency, effectiveness, and equity, corresponding to economic cost, service quality, and fairness. In particular, this study regards human suffering as a measure of the effectiveness of resource allocation, and directly uses the deprivation costs to depict human suffering. However, the previous studies did not investigate the deprivation cost function with heterogeneity and hysteresis effects. Due to the introduction of deprivation costs, the objective function of this problem is exponential, i.e., nonlinear. Coupled with the multi-period and uncertainty of resource allocation problem, this research intends to adopt reinforcement learning to solve the problem. Specifically, this research studies the multi-period resource allocation problems under uncertain demand with two deprivation cost functions, including heterogeneity and hysteresis effects. Respectively, the corresponding mathematical optimization models are established and the reinforcement learning method is developed to obtain the efficient solutions. This research can make up for the deficiencies of static and deterministic problems, making research closer to reality and thus more widely used.

灾后救灾物资的分配作为人道主义物流运作的核心,对灾民的安全和健康至关重要。在时间紧迫和物资匮乏的情况下,救灾物资分配是一个困难而且复杂的决策过程,往往需要考虑三个绩效指标:效率、有效性和公平性,分别对应于物资分配的经济成本、服务质量和公平性。特别地,本研究将灾民痛苦视为物资分配有效性的度量,并直接采用剥夺成本显性地刻画灾民痛苦。然而,具有异质性和滞后性的剥夺成本函数是之前的研究未涉及的。针对由于引入剥夺成本导致的非线性性,以及救灾物资分配问题具有的多周期和不确定性,本课题拟采用强化学习算法进行求解。具体来讲,本课题在前期的研究基础上,考虑物资分配问题的多周期性和需求不确定性,在异质性、滞后性两种剥夺成本函数类型下,分别建立对应的数学优化模型,拟采用强化学习算法进行有效求解。该研究能弥补静态、确定性问题研究的不足,使灾民痛苦的刻画更贴近实际,从而得到更加广泛的应用。

项目摘要

本项目主要是在考虑灾民痛苦的确定性灾后救灾物资分配问题基础上,基于强化学习理论,进一步研究考虑了异质性、滞后性剥夺成本函数的多周期、不确定、非线性的物资分配问题。具体地,本课题从问题和求解算法开展以下四项研究工作,分别是:1)基于动态变化需求的救灾物资分配问题,2)基于异质性需求的救灾物资分配问题,3)基于滞后性剥夺成本函数的救灾物资分配问题,4)基于强化学习的救灾物资分配问题。第一部分基于动态变化需求的救灾物资分配问题的研究,建立了非线性混合整数规划模型进行求解,并引入了强化学习中的Q-learning算法进行求解。本课题论证了该方法对救灾物资分配问题的适用性。第二部分基于异质性的救灾物资分配问题的研究,通过对剥夺成本函数的持续关注与调研,刻画了不同受灾区的需求异质性,建立了非线性混合整数规划模型,引入深度强化学习算法进行求解,目前正在做数值实验。第四部分基于强化学习的救灾物资分配问题的研究,融入在前两部份的研究中,重点在对强化学习算法的改进、对深度强化学习的引入方面。最后,第三部分基于滞后性剥夺成本函数的救灾物资分配问题的研究,调研了最新剥夺成本函数的研究进展,但并未发现对滞后性的量化研究。这部分研究除了选取滞后性曲线参数困难之外,还存在刻画方式是否合理的弊端,后续研究将继续改进。

项目成果
{{index+1}}

{{i.achievement_title}}

{{i.achievement_title}}

DOI:{{i.doi}}
发表时间:{{i.publish_year}}

暂无此项成果

数据更新时间:2023-05-31

其他相关文献

1

涡度相关技术及其在陆地生态系统通量研究中的应用

涡度相关技术及其在陆地生态系统通量研究中的应用

DOI:10.17521/cjpe.2019.0351
发表时间:2020
2

监管的非对称性、盈余管理模式选择与证监会执法效率?

监管的非对称性、盈余管理模式选择与证监会执法效率?

DOI:
发表时间:2016
3

农超对接模式中利益分配问题研究

农超对接模式中利益分配问题研究

DOI:10.16517/j.cnki.cn12-1034/f.2015.03.030
发表时间:2015
4

黄河流域水资源利用时空演变特征及驱动要素

黄河流域水资源利用时空演变特征及驱动要素

DOI:10.18402/resci.2020.12.01
发表时间:2020
5

拥堵路网交通流均衡分配模型

拥堵路网交通流均衡分配模型

DOI:10.11918/j.issn.0367-6234.201804030
发表时间:2019

于丽娜的其他基金

相似国自然基金

1

蓄意致灾非常规突发事件动态应急决策研究

批准号:91024016
批准年份:2010
负责人:申世飞
学科分类:G0409
资助金额:35.00
项目类别:重大研究计划
2

基于群智感知的矿井灾后无线应急通信网络关键问题研究

批准号:51904294
批准年份:2019
负责人:高守婉
学科分类:E0408
资助金额:25.00
项目类别:青年科学基金项目
3

动态不确定环境下应急救灾物资调配模型研究

批准号:41701594
批准年份:2017
负责人:王海雷
学科分类:D0716
资助金额:24.00
项目类别:青年科学基金项目
4

基于动态决策和数据挖掘的集装箱翻倒问题研究

批准号:71872092
批准年份:2018
负责人:张灿荣
学科分类:G0211
资助金额:48.00
项目类别:面上项目