基于OpenCL的连续数据无关访存密集型函数并行与优化研究

蒋丽媛; 张云泉; 龙国平; 贾海鹏

摘要

连续的数据无关是指计算目标矩阵连续的元素时使用的源矩阵元素之间没有关系且也为连续的,访存密集型是指函数的计算量较小,但是有大量的数据传输操作。在OpenCL框架下,以bitwise函数为例,研究和实现了连续数据无关访存密集型函数在GPU平台上的并行与优化。在考察向量化、线程组织方式和指令选择优化等多个优化角度在不同的GPU硬件平台上对性能的影响之后,实现了这个函数的跨平台性能移植。实验结果表明,在不考虑数据传输的前提下,优化后的函数与这个函数在OpenCV库中的CPU版本相比,在AMD HD 5850GPU达到了平均40倍的性能加速比;在AMD HD 7970GPU达到了平均90倍的性能加速比...

单位
中国科学院软件研究所; 中国海洋大学; 计算机科学国家重点实验室; 中国科学院研究生院

收藏分享被引浏览

更新时间：2020-06-17 09:18

基于OpenCL的连续数据无关访存密集型函数并行与优化研究

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友