摘要

针对最小二乘支持向量机对异常值敏感、缺乏鲁棒性的情况,提出一种考虑样本异常值的改进最小二乘支持向量机算法。该算法首先通过采用局部异常因子检测算法为每个数据样本计算一个LOF因子,根据其因子值能够有效地将样本分成正常样本和异常样本,然后针对不同样本进行单独设置样本权重。其有效地保证了在降低异常样本权重的同时而不使正常样本权重受到影响,使最小二乘支持向量机在达到目标函数最优化的同时能够保证正常数据信息不丢失,以提高模型的鲁棒性。最后,通过引入"信息熵"和"平均粒距"来改进粒子群算法,将其应用于模型的参数优化。经过实验仿真表明,该算法能够有效地提高模型的鲁棒性,随着异常样本的增多,其模型精度提高大约67%。

全文