摘要

开放集识别(Open Set Recognition, OSR)的主要目的是识别未标记数据中的新类样本,同时对已见类样本进行正确分类。现有的大多数识别方法对未标记数据的评估和伪标记信息的利用不足。本文提出一种基于主动学习的开放集图像识别方法(Open Set Image Recognition Method Based on Active Learning, AC-OSIR),充分利用未标记数据提升开放集识别性能。通过引入已见类别的语义知识,构建语义知识和图像特征的映射关系。对于未标记数据,利用阈值选择策略区分开放集样本和已见类样本,通过主动学习模型迭代地识别高置信度开放集样本和已见类样本,并将高置信度已见类样本添加到标记数据集中。本文在图像分类数据集CIFAR-10、TIN和LSUN,以及两个合成数据集的实验结果表明了基于主动学习的开放集图像识别方法的有效性。