摘要
针对卷积神经网络算法FPGA硬件加速器存在的内存带宽瓶颈,提出了一种基于次级缓存的行重组调度策略。通过分析SDRAM存储器的性能、FPGA硬件加速原理和内存带宽瓶颈,建立了次级缓存机制。该机制可服务于加速过程中堆叠的访问请求,通过合并相同Bank/Row的访问请求,减少Active和Precharge操作的额外开销。实验测试结果表明,在SC-RR调度策略下,存储器的访存时间减少32.87%,功耗降低31.71%,有效带宽利用率提高到91.3%。在性能相近的情况下,硬件资源消耗减少83.8%,满足了设计要求。
- 单位