摘要

当前,微机系统大多使用GPGPU设备加速计算,但是使用底层API进行并行加速效率不高且计算繁琐,使用基于指令的更高级抽象编程可解决这个问题。Open ACC就是为解决CUDA、Open CL等底层API开发的复杂性而开发出来的。笔者针对一种素数生成算法,分别使用CPU、CUDA、Open ACC实现,比较它们各自的效率,结果发现虽然Open ACC相比于CUDA性能要差一点,但是相比于CUDA陡峭的学习曲线和不高的开发效率,Open ACC有很高的性价比,并且随着硬件技术和编译器的发展,Open ACC有着非常广的发展空间。