摘要

本发明公开了一种基于定长服务排队模型的云平台自动伸缩方法,包括搭建容器编排平台和云监控平台,通过周期性采集云平台应用服务历史CPU负载数据,并对下一周期云平台应用服务的CPU负载值进行预测;根据单一应用服务的任务相似性及CPU负载的预测值,获得下一个采样周期内到达的任务数量,应用服务的任务最大延迟,并为系统容器数量设置阈值;以采样周期为单位时间间隔,构建定长服务M/D/1模型,根据模型的服务强度计算系统忙期时长;采用遍历法搜索定长服务M/D/1模型优化目标的最优解,作为系统下一个采样周期的最优容器数量。本发明在解决云平台响应式自动伸缩的滞后性、资源分配不足和资源浪费的问题上具有较好的效果。