摘要

<正>AI深度学习模型训练过程中,计算力消耗非常高。随着以预训练模型为代表的大模型(参数规模亿级到万亿级别)在NLP、生命科学、智能交通等领域的应用,AI算力消耗未来仍将持续快速增长。Dell EMC发布的AI GPU分布式训练解决方案,包含从硬件架构到软件优化的端到端方案设计,为用户构建从几十张到上千张GPU规模的AI集群提供一站式服务。