摘要

<正>深度学习推理引擎是人工智能(AI)软件的基础组件。通过将深度学习模型解析成计算图,推理引擎实现了模型的优化并支持在不同设备上运行时的加速推理。推理引擎的质量关乎其上层所有模型的质量,因此,开展深度学习推理引擎的测试是保障AI软件质量的重要环节。然而,AI测试中关于推理引擎测试的研究还存在诸多技术挑战:一方面,难以生成多样化的模型来覆盖推理引擎算子之间的连接组合,从而难以触发推理引擎的缺陷;另一方面,已有的度量方式(代码覆盖/神经元覆盖)只能刻画单个模型的质量,而不能反映需要多样化模型测试的推理引擎的质量。