面向复杂数据流的集成分类综述

作者:张喜龙; 韩萌*; 陈志强; 武红鑫; 李慕航
来源:广西师范大学学报(自然科学版), 2022, 40(04): 1-21.
DOI:10.16088/j.issn.1001-6600.2021071102

摘要

随着大数据的快速发展,挖掘有价值的知识可能会面临高维、大量、动态数据的影响,这些复杂数据流的出现会导致分类效果下降。为了进一步分析数据流集成分类的研究现状和面临的挑战,本文对复杂数据流集成分类进行综述以供进一步研究,从复杂数据流、领域数据流角度重点介绍了目前算法的核心思想以及性能。其中,复杂数据流主要介绍概念漂移、不平衡、多标签数据流等;然后,介绍文本、图、传感器等领域数据流,归纳了集成学习在领域数据流中的应用;之后,从验证技术、评估指标方面对数据流评估方法进行介绍;最后,展望未来研究可能的几个方向,包括不确定数据流集成分类的挑战、多种数据流并存集成分类的挑战、延迟数据流集成分类的挑战、数据流分类评估方法的挑战等。

全文