本文讨论的是基于CUDA并行计算架构对折叠进行GPU并行化,在并行之前对折叠先进行优化,消除其中的数据循环依赖并且重构目标函数,重写CUDA核函数在GPU上实现折叠并取得良好的效果。PRESTO(PulsaR Exploration and Search Toolkit)是一套完整开源的脉冲星搜索工具,其中包含适于各个搜索流程的工具。折叠(prepfold)也是其中之一,是用于搜索周期信号的,对候选体折叠生成相应的脉冲轮廓图,并基于这些脉冲轮廓图对候选体进行初筛。