本发明公开了一种面向分布式系统的多组件故障解释方法及装置。所述方法包括以下步骤:从分布式系统获取多个待检测组件历史运行数据;训练基于分步注意力机制的特征表示网络,获取超圆代价函数数值最小时的最优网络权重;以最优网络权重构建在线故障解释网络模型;构建基于多数表决的分类决策规则;以k个最近邻故障样本作为待检测故障样本的解释。由此所提出的故障解释方案能够准确地发现与待检测故障最相似的历史故障样本,并以历史故障样本作为参照,给待检测故障样本提供切实可行的消除方案。