摘要

集群计算系统在大数据处理、指挥调度等领域应用越来越广泛,保障集群系统稳定运行迫在眉睫。本文针对集群内计算机管理难度大、故障影响大等问题,明确集群计算机的监控需求,研究集群计算机的监控技术,分析Cacti、Parmon、Nagios、Zenoss、Ganglia等集群监控软件的特点,通过试验对比,总结各监控软件的功能特点,探讨集群计算机监控技术的发展方向。