机器视觉应用中的图像数据增广综述

作者:林成创; 单纯; 赵淦森; 杨志荣; 彭璟; 陈少洁; 黄润桦; 李壮伟; 易序晟; 杜嘉华; 李双印; 罗浩宇; 樊小毛; 陈冰川
来源:计算机科学与探索, 2021, 15(04): 583-611.

摘要

深度学习是目前机器视觉的前沿解决方案,而海量高质量的训练数据集是深度学习解决机器视觉问题的基本保障。收集和准确标注图像数据集是一个极其费时且代价昂贵的过程。随着机器视觉的广泛应用,这个问题将会越来越突出。图像增广技术是一种有效解决深度学习在少量或者低质量训练数据中进行训练的一种技术手段,该技术不断地伴随着深度学习与机器视觉的发展。系统性梳理当前图像增广技术研究,从增广对象、增广空间、标签处理和增广策略生成的角度,分析现有图像增广技术的研究范式。依据研究范式提出现有图像增广技术的分类系统,重点介绍每类图像增广研究的代表性研究成果。最后,对现有图像增广研究进行总结,指出当前图像增广研究中存在的问题及未来的发展趋势。