摘要
利用集成模型可以应对实时数据流分类问题中的概念漂移.许多经典集成算法都是通过对数据采样,或者通过对概念漂移的检测从而进行集成模型的更新来应对数据流种产生的概念漂移问题的.如何使得模型可以及时的在当前的概念上迅速建立模型一直是在线数据流学习关注的问题.本文使用增量学习和迁移学习的思想提出了一种新的历史模型自适应概念漂移的数据流集成分类算法HAEL,在集成模型中引入注意力机制,可以始终优先关注当前的数据来构建和更新分类模型,并且提出通过利用准确率比较范围参数来调整模型对当前数据的关注程度,从而使得模型更好的应对概念漂移.通过在四种类型的概念漂移数据集上的实验表明,HAEL与传统算法相比均表现出更高的分类准确率.
- 单位