摘要
针对传统集成分类算法中,一般将集成数目设置为固定值,可能会导致较低分类准确率这一问题,提出了准确率爬坡集成分类算法(C-ECA)。该算法不再替换相同数目的基分类器,而是基于准确率对基分类器进行更新,最终确定最佳集成数目。其次,在C-ECA算法的基础上提出了基于爬坡的动态加权集成分类算法(C-DWECA),该算法提出了一个加权函数,在具有不同特征的数据流上训练基分类器时,可以获得基分类器的最佳权值,从而提升集成分类器的性能。最后,为了能更早的检测概念漂移,提高最终精度,本文采用了快速霍夫丁漂移检测方法(FHDDM)。最后,实验表明C-DWECA算法准确率最高可达到97.44%,并且算法的平均准确率比自适应多样性的在线增强算法(ADOB)提升了40%左右,算法的准确率也优于其它对比算法。
- 单位