摘要
深度学习商品识别技术存在有标签数据获取成本高、无标签数据获取简单高效的问题,给技术的实际应用造成了一定障碍。为解决在少量有标签数据下用大量无标签数据提高模型准确率的问题,提出一种半监督学习方法。使用基于self-training的方式训练两个目标检测模型;在检测模型的损失函数中加入基于熵的正则化项,提高无标签预测的准确性;为避免错误伪标签数据不断被使用,采取co-training的训练方式。通过构建包含16 000幅图片的商品识别数据集,最终实验结果表明,相比没有利用无标签数据之前,SSD模型的精度从90.6%提高到了97.2%,YOLOv3模型精度从91.7%提高到了96.9%。
- 单位