摘要

人工智能辅助的医学图像识别诊疗系统应用面非常广泛,然而在当前医疗环境和社会背景下难以收集到足够多的数据来训练模型,利用数据增强技术对已有样本进行处理可以显著缓解训练数据缺乏的问题。本文就近年来出现的较为常用的图像增强技术进行简要概述,根据样本处理数量,将已有的数据增强技术分为单样本数据增强和多样本数据增强两大类。其中单样本数据增强又根据处理水平分为像素水平处理和整体水平几何处理;而多样本数据增强则主要介绍了以合成少数过采样算法(SMOTE)和生成对抗网络(GAN)等为代表的以整个样本集为操作对象,通过调整采样比例缓解类不平衡现象的算法。此外,本文还对每种方法的优缺点进行分析,总结了近年来上述算法的实现和改进,以期为相关从业者提供新思路。