摘要
在集群环境中部署微服务已经成为微服务部署的重要方式.由于不同种类服务对于CPU、内存、磁盘等资源的需求不同,导致集群中的节点产生资源碎片、出现资源消耗倾斜.如何提高集群资源利用率、降低集群能耗,成为继保障服务级别协议(service level agreement, SLA)之后的重大挑战.本文以阿里巴巴集团2021年发布的近两万个微服务的详细跟踪为数据样本,从容器资源使用情况、节点部署特征和资源消耗偏好等多个维度出发,分析其集群资源消耗特征,发现集群中出现了资源消耗倾斜的情况.通过进一步分析节点中容器部署情况发现容器资源分配不合理加剧了这一现象.基于此我们提出了一种使用深度双Q网络的模型,依据上游服务资源需求的实时变化,对容器资源分配进行优化.对比实验结果表明该方法可以在保证服务SLA的情况下有效提高容器资源利用率,改善节点资源消耗倾斜的情况.
- 单位