用于深度学习训练加速的自适应框架设计

范涛; 樊平; 成元庆<sup>*</sup>

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

用于深度学习训练加速的自适应框架设计

作者：范涛; 樊平; 成元庆^*

来源：计算机辅助设计与图形学学报, 2021, 33(06): 974-982.

摘要

用FPGA加速深度学习算法的训练过程通常需要较长的开发周期和丰富的硬件设计经验.为了应对这一挑战,设计了一种基于自适应模板技术的深度学习算法训练加速框架,在应用规模、并行调度策略、资源使用和功能扩展上进行了深入的研究并提出了相应的优化策略.采用CPU-FPGA异构加速模板技术,提出了自适应的上层模型编译框架实现与不同硬件加速资源的适配.这种基于定制模板的软硬件协同设计可以很好地适配不同的FPGA芯片并支持算法的快速迭代.用图神经网络算法数据进行加速对比实验,实现了与CPU相比7～41倍的速度提升.

单位
北京航空航天大学

收藏分享被引浏览

更新时间：2024-04-18 01:24

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号