摘要

由于临床数据集的建设难度大,且数据构成、数据容量、标注标准化程度要求较高,使用测试集评价人工智能(Artificial Intelligence,AI)产品泛化能力的推广难度较大。作为标准测试集的补充,使用对抗性样本有可能提供有意义的扩展。本研究根据数学物理模型对现有数据进行变换,观测AI的变化。结果发现不同的算法在图像压缩、图像裁剪、图像滤波测试中灵敏度和特异性的表现具有明显差异。本文在模拟对抗上进行了初步的探索,将该方法运用于算法性能评价,结果表明该方法能够从新的角度反应AI产品的性能,辅助对其泛化能力的评价。

  • 单位
    中国食品药品检定研究院