针对多尺度视网膜增强算法在图像增强过程中存在运算时间较长的问题,给出一种基于CPU-GPU并行加速的多尺度视网膜算法。在并行化设计时,对CUDA如何管理GPU的硬件资源能够在GPU硬件资源量固定的情况下启动更多的线程参与计算进行深入讨论和公式化求解;对GPU并行模型进行改进,充分利用CPU和GPU资源;通过3个CPU线程实现R、G、B通道的并行,每个通道的增强过程通过GPU并行。在对多种场景图片的CPU-GPU并行加速处理的实验中得到了高达267倍的加速比。