摘要
针对不同领域人工智能(AI)应用研究所面临的采用常规手段获取大量样本时耗时耗力耗财的问题,许多AI研究领域提出了各种各样的样本增广方法。首先,对样本增广的研究背景与意义进行介绍;其次,归纳了几种公知领域(包括自然图像识别、字符识别、语义分析)的样本增广方法,并在此基础上详细论述了医学影像辅助诊断方面的样本获取或增广方法,包括X光片、计算机断层成像(CT)图像、磁共振成像(MRI)图像的样本增广方法;最后,对AI应用领域数据增广方法存在的关键问题进行总结,并对未来的发展趋势进行展望。经归纳总结可知,获取足够数量且具有广泛代表性的训练样本是所有领域AI研发的关键环节。无论是公知领域还是专业领域都进行样本增广,且不同领域甚至同一领域的不同研究方向,其样本获取或增广方法均不相同。此外,样本增广并不是简单地增加样本数量,而是尽可能再现小样本量无法完全覆盖的真实样本存在,进而提高样本多样性,增强AI系统性能。
- 单位