基于稀疏子空间聚类的主动学习算法

作者:姜秀波; 钟丽媛*; 宋曹根
来源:计算技术与自动化, 2021, 40(04): 69-73.
DOI:10.16339/j.cnki.jsjsyzdh.202104013

摘要

主动学习已经被证明是一种成功的机器学习算法,最主要的缺点是它只注重样本的标签信息而忽略了样本的分布信息。因此带来的后果就是稳定性差,容易陷入局部最优解,同时对初始样本的选择非常敏感。论文将稀疏子空间聚类与主动学习相结合,首先利用稀疏子空间聚类找到原始数据的分布信息,然后利用该信息指导主动学习选取初始样本,使样本标注更加有效,提高了主动学习的效率,同时降低了主动学习对初始样本的敏感度。最后通过多组仿真实验证明,本方法可以有效的改善主动学习的性能。