申威26010众核处理器上一维FFT实现与优化

作者:赵玉文; 敖玉龙; 杨超*; 刘芳芳; 尹万旺; 林蓉芬
来源:软件学报, 2020, 31(10): 3184-3196.
DOI:10.13328/j.cnki.jos.005848

摘要

根据申威26010众核处理器的特点提出了基于两层分解的一维FFT众核并行算法.该算法基于迭代的StockhamFFT计算框架和Cooley-TukeyFFT算法,将大规模FFT分解成一系列的小规模FFT来计算,并通过设计合理的任务划分方式、寄存器通信、双缓冲以及SIMD向量化等与计算平台相关的优化方法来提高FFT的计算性能.最后对所提出算法的性能进行了测试,相比于单主核上运行的FFTW3.3.4库,获得了平均44.53x的加速比,最高加速比可达56.33x,且其带宽利用率最高可达83.45%.

全文