LBM伪势MRT三维模型GPU并行计算的性能优化

彭浩; 单鸣雷<sup>*</sup>; 朱昌平; 姚澄

doi:10.19596/j.cnki.1001-246x.7698

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

LBM伪势MRT三维模型GPU并行计算的性能优化

作者：彭浩; 单鸣雷^*; 朱昌平; 姚澄

来源：计算物理, 2018, 35(05): 554-562.

DOI：10.19596/j.cnki.1001-246x.7698

摘要

格子Boltzmann方法伪势模型算法中的格点间计算未完全局部化,因此在并行计算时需要更多次的全局内存读写、使用更多数量的寄存器和线程同步操作,从而导致GPU并行计算效率下降.本文针对伪势模型并行计算的局限性,基于三维十五速格子结构的多松弛时间伪势模型,以气液相分离为算例,通过合并访问的方式提高全局内存的读写效率;并提出一种"定向转移"算法,提高格子边界格点获取邻居格点数据的效率;最后探索不同资源分配中各种因素对计算效率的影响,总结最优资源分配的方法.

单位
河海大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-04-23 23:36

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号