晶硅分子动力学模拟的GPU加速算法与优化

作者:林琳; 祝爱琦; 赵明璨; 张帅; 叶炎昊; 徐骥; 韩林; 赵荣彩; 侯超峰
来源:计算机工程, 2022, 1-10.
DOI:10.19678/j.issn.1000-3428.0064457

摘要

分子动力学是研究硅纳米薄膜热力学性质的主要方法之一,但存在数据处理量大、计算密集、原子间作用模型复杂等问题,限制了分子动力学模拟的深入应用。面对分子动力学模拟中的大量计算负载,利用具有强大并行计算能力和高浮点性能的图形处理器GPU,对晶硅分子动力学模拟算法进行性能优化。文中基于图形处理器GPU硬件特性和晶硅分子动力学模拟算法的性能瓶颈分析,针对晶硅分子动力学模拟动态邻居算法提出了合并访存的优化设计,改进了GPU加速算法的访存效率和计算吞吐量。针对算法执行过程的分支冲突问题,提出了循环展开的优化方法,提高了GPU并行计算资源的利用率。最后,针对原子间作用力的计算利用原子操作减少了显存访问,提高了算法的整体计算效率。计算测试表明,优化后晶硅分子动力学模拟算法的计算性能相比优化前提高了1.60~1.97倍,相比国际上主要的GPU加速分子动力学模拟软件HOOMD-blue和使用GPU加速包加速的LAMMPS,分别提高了3.20~3.47倍和17.40~38.04倍,取得了良好的加速效果。

全文