JPEG有损压缩算法以DCT变换算法为核心,但DCT变换算法较为耗时,为提升图像压缩效率,提出利用基于GPU平台的CUDA技术对DCT算法做并行优化。通过分析DCT变换算法的原理,发现DCT算法具有很好的并行性,优化空间较大,于是利用CUDA技术实现高速DCT并行算法。实验结果表明,在一张2592×2592分辨率的图像做DCT变换,加速比能达到124.5,算法效率得到明显提升,且压缩效果无显著差异。