摘要
发展了一种基于GPU加速的间断Galerkin(DG)方法,用以计算二维层流流动。通过统一设备架构(Compute unified device architecture,CUDA),结合DG方法高阶精度的特点,基于分量存储涉及的数据,基于单元或边组织线程结构,将求解Navier-Stokes方程的DG CPU程序移植到GPU,涉及的无黏和黏性数值通量分别采用Local Lax-Friedrichs格式和BR2格式,时间推进采用强稳定性保持的Runge-Kutta格式。首先在不同的网格尺寸和拟合精度下计算Couette流动问题,证实了算法能取得预期的收敛精度;接着将圆柱绕流和NACA0012翼型绕流的计算结果与文献和实验结果进行对比,并依据加速比分析程序性能。结果表明在不损失准确度的前提下,与CPU程序相比,本文发展的GPU程序能显著减少计算时间,最高能够取得69.7倍的加速比。
- 单位