摘要

为了给用户提供按需使用的HPC服务并解决用户应用部署的软件依赖性问题,在不破坏现有超大规模高性能集群管理的前提下,基于Fat-Tree网络拓扑和虚拟集群模型,通过对部分资源进行云化管理,设计并实现了一种轻量级的HPC集群交付模式。从而为面向租户需求的高性能应用提供一种云化的HPC租用服务,并解决了HPC应用软件栈的僵化问题,以易用的方式为更多的HPC租户提供服务。实验结果表明,该方法以近似物理节点的性能使HPC具备了云的按需使用的特性,并具有较为理想的植入效率。