摘要

针对以基础设施服务(IaaS)为主的云服务提供商,对部署在其上的Web应用以虚拟机为弹性粒度进行了弹性策略研究,提出一种基于强化学习的弹性伸缩算法PDS-lambda。该算法综合考虑用户服务违约,应用的当前负载及虚拟机数量,利用决策后状态(PDS)把算法需要学习的信息划分为动态已知与动态未知,使算法只学习动态未知的那一部分并且采用多步更新来快速达到收敛。算法对Web应用进行弹性扩张与弹性收缩操作来调整其拥有的虚拟机数量,使其在满足用户服务质量同时尽可能降低运行成本,提高云平台可靠性。仿真实验结果表明,该算法同已有的强化学习相关算法相比能更快达到收敛,且平均成本更低,用户服务违约更少。