摘要
针对云计算环境下多用户多资源虚拟机调度的延迟问题,为了优化虚拟机的任务完成时间,提出一种基于强化学习的虚拟机资源调度方法。首先以虚拟机的任务完成时间为优化目标建立基于延迟的虚拟机资源调度模型,然后通过定义虚拟机配置数组来将多资源多类的虚拟机资源调度问题转化为单维的虚拟机调度决策问题,接着提出面向延迟的虚拟机资源调度强化学习算法,将任务完成时间作为奖赏函数,通过贪婪行为策略选择最优的调度策略来达到最大奖励,从而获得最优的平均任务完成时间。仿真结果表明,与现有算法相比,该方法在提高虚拟机资源利用率与减少任务的延迟方面性能显著。
- 单位