CNN景象匹配算法的加速设计与FPGA实现

王晓峰<sup>*</sup>; 李超然; 路坤锋; 栾天娇; 姚娜; 周辉; 谢宇嘉

摘要

基于卷积神经网络的景象匹配算法较传统方法具有更高的匹配精度、更好的适应性以及更强的抗干扰能力。但是，该算法有海量的计算与存储需求，导致在边缘端部署存在巨大困难。为了提升计算实时性，文中设计并实现了一种高效的边缘端加速计算方案。在分析算法的计算特性与整体架构的基础上，基于Winograd快速卷积方法，设计了一种面向特征匹配层的专用加速器，并提出了利用专用加速器与深度学习处理器流水线式计算特征匹配层和特征提取网络的整体加速方案。在Xilinx的ZCU102开发板上进行实验发现，专用加速器的峰值算力达到576 GOPS,实际算力达422.08 GOPS,DSP的使用效率达4.5 Ope-ration/clock。加速计算系统的峰值算力达1 600 GOPS,将CNN景象匹配算法的吞吐时延降低至157.89 ms。实验结果表明，该加速计算方案能高效利用FPGA的计算资源，实现CNN景象匹配算法的实时计算。

单位
北京航天自动控制研究所

收藏分享被引浏览

更新时间：2024-03-18 21:40

CNN景象匹配算法的加速设计与FPGA实现

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友