摘要
针对当前云计算技术的发展,以及传统人工智能训练平台开发存在的资源利用局限,提出一种基于Docker技术+Kubernetes集群的人工智能训练开发平台。在该平台中结合Kubernetes集群调度原理,采用Max Resource Usage Priority优选算法,按照评分高低的方式对宿主机节点进行选择,以提高对Kubernetes集群中资源的利用率。然后为适应未来Kubernetes集群资源的动态调整,提出一种基于现有各节点使用情况的资源使用预测模型,并在传统ARMIA模型的基础上,提出改进的RBF组合模型,以提高预测的准确率。结果表明,以上方法可有效提高资源利用率,以及提高Kubernetes集群中资源预测效率。
-
单位广东电力信息科技有限公司; 广东电网有限责任公司信息中心; 南方电网数字电网研究院有限公司