摘要

本发明公开了一种基于多模型协作对比学习的负样本采样方法,包括:1)构建多个对比学习模型并约束它们学习数据的不同特征子空间;2)每个对比学习模型在自身特征空间使用潜在正样本识别算法挑选出潜在正样本集合;3)结合不同模型对潜在正样本识别结果,从候选负样本集合中剔除潜在正样本,筛选出初步的负样本集合;4)使用难负样本挖掘算法从初步的负样本集合挑选难负样本作为最终参与对比学习训练的负样本集合。本发明通过引入多个模型协作采样,能够消除因模型自身特征空间的偏差而引入采样偏差问题,更全面剔除负样本集合中的潜在正样本,提高难负样本的质量,从而提升对比学习模型的泛化能力,更好应用到下游任务。