面向国产加速器的CFD核心算法并行优化

曹义魁; 陆忠华; 张鉴; 刘夏真; 袁武; 梁姗

摘要

【目的】为了加快国产CFD软件的计算速度,本文设计并实现了基于国产加速器的加速版本。【方法】基于CCFD V3.0版本,将软件的核心算法移植到国产加速器,并采用多种方法进行优化。【结果】使用128*128*128大小的网格进行实验,移植后的程序模拟结果与原CPU版本基本一致,单加速卡相比于单CPU核心,对流项计算部分取得了166倍的加速,ADI迭代计算部分取得了59倍的加速。【局限】由于CFD软件模块较多,未对整个程序进行移植优化,未来会将软件都移植到国产加速器上进行加速。【结论】本文实现了基于国产加速器的CFD核心算法并行优化,取得了较好的加速效果,为以后CFD软件的移植与优化工作提供了经验和参考。

单位
中国科学院计算机网络信息中心; 中国科学院大学

收藏分享被引浏览

更新时间：2024-11-28 23:17

面向国产加速器的CFD核心算法并行优化

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友