基于共享GPU的深度学习训练性能实证研究

作者:徐涣霖; 顾嘉臻; 康昱; 周扬帆
来源:计算机应用与软件, 2022, 39(12): 152-158.
DOI:10.3969/j.issn.1000-386x.2022.12.023

摘要

深度学习应用的训练过程是计算密集型的,它通常依靠图形处理单元(Graphics Processing Unit, GPU)来加速训练过程。然而深度学习开发框架往往会独占GPU,造成计算资源的浪费。针对该问题,该实证研究对两个深度学习应用共享GPU训练的可行性进行讨论,系统地分析了有代表性的深度学习模型的静态和运行时特性,展示了共享GPU训练两个模型时,不同的模型组合和特征对整体性能的影响。根据实验结果所总结的原则可以作为提高调度效率和改善GPU云资源利用率的指导方针。

全文