本文设计了基于CPU的Bitslice方法进行枚举DES密钥,同时也实现了基于GPU多线程并行化的程序。阐述了GPU并行程序的设计方案和实现步骤,GPU并行化程序较CPU单线程有38.2倍的性能提升。对基于CPU上的Bitslice程序和基于GPU上的Bitslice程序进行了性能对比分析。提出了单核使用Stream流技术进行了优化的方案,进而为基于MPI多机多核的GPU高性能集群并行计算奠定基础。