摘要

目的 探索半监督学习算法在内镜图像长尾分类中的应用.方法 我们在HyperKvasir数据集上探索了半监督的内镜图像长尾分类,该数据集是最大的胃肠道公共数据集,有23个不同的类别.使用基于一致性正则化和伪标签的半监督学习算法FixMatch,在将训练数据集和测试数据集按4∶1的比例进行划分后,按照20%、50%和100%的比例抽取有标签的训练样本,以测试在有标签数据有限下的分类性能.结果 通过微观平均、宏观平均评价指标和马修斯相关系数(Mathews correlation coefficient,MCC)作为总体评价指标来评估分类性能.半监督学习算法在有标签训练数据比例为20%、50%和100%的情况下,MCC分别从0.8761提高到 0.8850、0.8983提高到0.8994、0.9075提高到0.9095.在有标签训练数据比例为20%的情况下,半监督学习算法可以提高微观平均和宏观平均的分类性能.对于50%和100%的情况,半监督学习算法可以提高微观平均下的分类性能,但会损害宏观平均的分类性能.通过分析每个类的混淆矩阵和标注偏差,我们发现基于伪标签的半监督学习算法加剧了分类器对头类的偏好,导致头类的性能提高而尾类的性能下降.结论 半监督学习算法可以提高内镜图像长尾分类的性能,特别是在标签极其有限的情况下,这可能有利于为小医院建立辅助诊断系统.然而,伪标签策略可能会放大类不平衡的影响,从而损害尾部类的分类性能.

全文