摘要

针对现有算法多标签分类器收敛效率低和标签查询策略未考虑特征辨别能力的弊端,提出一种新的多标签在线主动学习算法——基于判别采样的多标签主动镜像梯度下降算法(MLAMD_D算法)。该算法能在较小的数据标注代价下取得较好的多标签分类性能。算法使用二元关联策略将包含C个标签的多标签分类问题分解成C个相互独立的二分类问题。在对每个二分类问题的处理上:MLAMD_D算法使用镜像梯度下降规则更新其二分类器,该更新规则使用一个对角矩阵记录实例中各个特征的更新信息,利用这些信息执行二阶更新。在识别需要查询真实标签的实例时,MLAMD_D算法采用了基于特征的判别信息的采样策略,该策略除了运用对实例预测的不确定程度外,还充分考虑了实例包含的特征的判别能力。将所提算法与现有的多标签在线主动学习算法以及基于随机采样的多标签主动镜像梯度下降算法(MLAMD_R算法)在6个多标签分类数据集上进行实验对比,实验结果表明,MLAMD_D算法的性能优于其对比算法。