摘要
使用CUDA(compute unified device architecture,统一计算架构),利用GPU(graphic processing unit,图像处理器)强大的并行能力实现DEM(discrete element method,离散单元法)的离散粒子系统模拟仿真。邻域搜索时使用基于哈希表排序的邻域搜索算法,依据CUDA内存模型的特点对系统做出有效的内存规划,并使用CUDA流技术通过将粒子碰撞和数据输出分割成4个流异步执行,来隐藏数据拷贝的部分延迟。通过使用CUDA的事件作为GPU计时器监测,实验证明本文中的并行搜索算法的执行效率很高,而使用合理的内存策略和流技术也可以有效的提高系统的性能。
- 单位