基于云平台的人工智能开源开发平台框架研究

作者:**涛; 郑杰生; 高尚; 刘文彬; 林嘉鑫; 董召杰; 王尧
来源:自动化与仪器仪表, 2020, (07): 159-166.
DOI:10.14016/j.cnki.1001-9227.2020.07.159

摘要

针对当前云计算技术的发展,以及传统人工智能训练平台开发存在的资源利用局限,提出一种基于Docker技术+Kubernetes集群的人工智能训练开发平台。在该平台中结合Kubernetes集群调度原理,采用Max Resource Usage Priority优选算法,按照评分高低的方式对宿主机节点进行选择,以提高对Kubernetes集群中资源的利用率。然后为适应未来Kubernetes集群资源的动态调整,提出一种基于现有各节点使用情况的资源使用预测模型,并在传统ARMIA模型的基础上,提出改进的RBF组合模型,以提高预测的准确率。结果表明,以上方法可有效提高资源利用率,以及提高Kubernetes集群中资源预测效率。