摘要

受损路网修复和物资配送是灾后应急响应初期的两个重要环节,主要研究如何制定道路抢修队和物资运输队的联合调度方案.然而,已有研究大都将路网修复和物资配送割裂开来考虑,难以满足实际救援需求.为此,本文在构建抢修队与运输队联合调度的路网模型的基础上,引入马尔科夫决策过程来模拟抢修队的修复活动和运输队的救援活动,分别设计了相应的状态、动作集和即时奖励函数.最后提出一种基于双层交互Q学习的路网抢修和物资配送联合调度算法.对比实验表明,本文所提方法能有效提高路网抢修和物资配送的效率,可为应急响应初期的救援与处置提供及时可靠的物资保障.

全文