摘要

该研究提出了一种基于多现场可编程门阵列异构平台的流水线技术优化方法。首先,基于二分法思想对任务进行划分,使任务量尽可能均衡地部署在不同现场可编程门阵列单元中,从而提高板级流水线均衡度;其次,针对板间传输延迟进行了流水线结构的优化,在板间延迟较大时,将板间延迟作为流水线的一级可以提高平台吞吐率;最后,并行优化计算单元内部模块,并通过数据关系重排、循环展开、循环流水线等手段充分利用现场可编程门阵列计算资源,提高吞吐率和能效比。采用AlexNet网络为例进行的验证结果显示,与优化之前的流水线结构相比,改进后的流水线结构吞吐率提高了215.6%,能效比提高了105.5%,单次任务运行时间减少了36.6%。