基于CUDA并行技术加速2维矩阵MOC方法的研究

作者:郑勇; 彭敏俊; 安萍; 强胜龙; 芦韡
来源:科技视界, 2021, (21): 99-102.
DOI:10.19694/j.cnki.issn2095-2457.2021.21.38

摘要

在中子输运理论中,矩阵形式的特征线方法因减少了射线扫描次数,相较于它的标准形式在理论上具有更优良的性能。在以前的工作中,经预条件后的极小残余算法(PGMRES)用于求解得到的矩阵方程。为了进一步加速迭代过程,文章采用了CUDA并行机制实现了并行版的PGMRES算法。采用合并访存和共享内存的方式对稀疏矩阵-向量乘(SpMV)操作进行了并行优化,极大地提高了并行计算性能。基于对矩阵方程系数矩阵的分析,提出了3种并行优化策略来加速矩阵方程的求解,并且根据系数矩阵行向量尺寸的不同而采取不同的加速方案,以此提升SpMV运算的数据吞吐率。为验证加速策略的有效性,对2维C5G7基准题进行了计算和结果讨论。数值计算表明,在C5G7问题中,无论是否采用CMFD方案,并行策略都是有效的;在最优的并行策略中,问题得到的最高加速比为5.5。

全文