摘要
基于深度学习的目标检测算法取得了很大成功,显著超越了传统算法,在很多场景下甚至可以和人类相媲美。不同于可见光相机,红外相机可以在黑暗环境下识别物体,可以用于安防和无人驾驶等领域。本文提出了面向嵌入式设备的轻量级目标检测算法,并采用赛灵思的Ultrascale+MPSo C ZU3EG FPGA加速并部署该算法。加速器运行在350 MHz的时钟频率下,吞吐量达到了551 FPS,功耗仅有8.4 W。在准确率方面,该算法在FLIR数据集下Io U指标达到了73.6%。在性能方面,相比于之前相同逻辑资源下性能最好的硬件加速器Ultranet,该加速器设计将吞吐量提高了2.59倍,功耗降低了2.04倍,降低至原来的49.02%。
-
单位上海科技大学; 中国科学院; 中国科学院大学; 中国科学院上海技术物理研究所