摘要

傅里叶空间图像相似度计算是冷冻电镜三维重建计算模型的重要组成部分,由于其大量的计算开销导致模型整体运行速度缓慢,从而引起了国内外众多相关研究学者的密切关注。虽然目前该模型能够通过使用OpenMP等多线程技术获得可观的性能提升,但其在单节点的性能仍得不到充分发挥。为了解决这样的问题,本文提出一种基于SIMD高效并行傅里叶空间图像相似度计算的方法。首先,通过手动负载均衡提升CPU的线程使用率,以最大化使用CPU资源。其次,利用高级矢量扩展AVX-512指令集充分发挥CPU矢量寄存器的作用,以获得更高的计算性能。最后,提出了一种新颖且高效的数据结构,该数据结构能更好的发挥Cache空间局部性优势。在Intel Xeon Platinum 9242实验平台上进行了实验,实验结果表明,与原始的OpenMP并行模型相比,优化后的程序平均获得5.132倍的加速比。不仅如此,优化后的程序还具有出色的鲁棒性。