网络的飞速发展,气象数值预报高分辨率循环同化系统对服务器提出了更高的要求,使用Linux操作系统构建高性能集群系统,用较低的价格实现高伸缩、高可用的计算服务,以弥补单台服务器无法达到的性能。本文以实际生产运行中的一则故障为例,剖析了系统运维中的一些方法。