摘要

基于分裂准则与相对质量算法对孤立森林算法进行了改进,优化了孤立森林算法的分支步骤与局部度量方式。利用标准数据集(Shuttle、Satellite、Annthyroid)验证了算法的有效性,并分析了算法复杂度;应用改进的孤立森林算法对某炼化企业催化裂化数据进行异常识别,与经典的孤立森林算法、SCiForest及ReMa-iForest的异常识别效果进行对比分析。结果表明:改进的孤立森林算法能够在提高模型精确度的同时提升算法的执行效率。研究提出的异常识别方法将为催化裂化监测数据的分析提供可靠数据支撑。