基于DNN算子并行的深度学习推理加速方法

徐飞; 陈奥东

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于DNN算子并行的深度学习推理加速方法

作者：徐飞; 陈奥东

来源：2023-09-08, 中国, CN202311157590.4.

摘要

本发明公开了一种基于DNN算子并行的深度学习推理加速方法,包括一个深度神经网络(Deep Neural Network,DNN)算子的流分配器和一个DNN算子发射器。具体而言,利用用户提供的DNN模型和输入张量(即推理数据),流分配器首先依据DNN模型结构确定算子所分配的CUDA流；然后,通过收集模型推理产生的离线性能数据,DNN算子发射器进一步使用基于资源需求和干扰感知的算子调度算法,在GPU上优化算子发射顺序；最后,结合CUDA流分配方案和算子发射顺序生成并行化的CUDA Graph,从而在GPU上实现高效的DNN推理。

单位
华东师范大学

收藏分享被引浏览

更新时间：2024-11-29 01:41

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号