摘要
针对电梯群组系统的随机性和复杂性,以离散事件动态系统和分布式部分可观马尔可夫决策过程为理论基础,将电梯群组的调度问题建模为基于事件驱动的部分可观马尔可夫决策模型,并利用多智能体强化学习算法求解最优调度策略。仿真实验结果表明,所提出的事件驱动Dec-POMDP调度模型不仅能够较好地描述电梯群组系统环境中的不确定性,而且能够避免维度灾难带来的策略优化难题,所得到的最优策略具有较好的调度性能。
-
单位锐捷网络股份有限公司; 合肥职业技术学院; 闽江学院