目前主流云计算服务实现涉及到多节点协同、多虚拟机协同、多云协同等混合计算模式,这一特点增加了系统实现的复杂程度,提高了故障的发生概率。系统运行过程中如果无法及时发现故障的存在,则会导致系统无法正确运行。针对这一问题,提出了一种基于数据分析的故障感知系统,该系统通过数据采集、数据分析与对比、故障研判、故障报告4个步骤,实现云计算环境中故障的自动检测与预警,提高了云计算系统对故障的感知能力。