海洋环流模式LICOM的GPU实现与优化

张留莹; 王鹏飞; 张峰; 刘海龙; 林鹏飞; 王涛; 韦俊林; 田少博; 姜金荣<sup>*</sup>; 迟学斌

摘要

【目的】为了加速海洋环流模式LICOM的积分计算,降低因分辨率的提升而带来的运行成本,本文设计并实现了基于CUDA C的GPU加速版本。【方法】本文基于目前最新的LICOM3版本,在分析LICOM海洋网格块的并行算法的基础上,结合使用CUDA线程并行计算海洋网格点,将LICOM主要计算程序移植到GPU平台上,并从数据传输和设备内存的使用两个方面进行优化。【结果】实验表明,GPU版本模拟结果的与原CPU版本基本一致。与使用相同数量的Intel Xeon E5-2680 V2 CPU相比,使用2至16块NVIDIA K20 GPU单个模式天加速了9.31到1.27倍。【局限】由于LICOM3计算的边界同步通信比较多,限制了程序的可扩展性,未来需要通过边界通信优化和算法优化来提高模式的可扩展性。【结论】本文对LICOM3程序进行了GPU版本的实现和优化,取得了一定的加速效果并保持较好的扩展性,为今后面向更大规模计算的海洋环流模式发展提供了经验和参考。

单位
中国科学院计算机网络信息中心; 中国科学院大气物理研究所; 中国科学院大学

收藏分享被引(2) 浏览

更新时间：2024-04-12 15:03

海洋环流模式LICOM的GPU实现与优化

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友