为确定燃油消耗数据中可能存在的异常点及强影响点,运用随机森林算法,对预处理后的某场站近三年燃料油消耗数据建模;对回归模型分别做残差分析和影响分析,不仅从残差图中观察出偏离既定模型很大的数据点,还仿照经典的统计诊断理论,定义诊断强影响点的统计量,可确定出对统计推断影响特别大的点;所得结论与逐步回归法一致。