摘要

针对云数据中心重调度算法大多是以牺牲云任务的完成时间或者增加云服务提供商的损失为代价的问题,系统分析了虚拟机故障所带来的性能损失和云数据中心容错策略的重调度过程。参考了Amazon云数据中心的真实定价机制,并对Amazon的多个云数据中心的虚拟机价格进行分析。同时,对失效的云任务根据截止时间进行了分类。利用不同配置虚拟机的定价差异提出了面向云数据中心的成本感知容错算法(Cost-aware Fault-tolerant Algorithm for Cloud Data Centers, CAFT)。该调度算法通过提高云任务的故障修复率从而降低云服务提供商的损失。实验仿真结果显示,相比IRW、RI和DTRDT算法,所提算法的故障修复率明显提升,同时,云服务提供商的损失平均降低了1.3%、13%和0.5%。