摘要
本发明提出了一种基于异构平台执行深度神经网络的系统及方法,用于解决现有技术中存在的基于异构平台执行深度神经网络的速度较低和对于模型的兼容性较差的技术问题,实现步骤为:(1)模型解析模块对DNN模型进行解析;(2)分析模块根据解析结果构建计算图;(3)平台检测模块检测异构平台中的异构计算单元的硬件参数;(4)任务分配模块构建任务分配策略并进行优化;(5)推理模块根据最优任务分配策略对异构计算单元进行任务分配,得到执行DNN模型的结果。本发明解析模块支持解析主流深度学习框架的模型格式,提高了系统对于不同框架模型的兼容性,任务分配模块提供最优任务分配策略,提高了深度神经网络的执行速度。
- 单位