摘要
GPU(Graphics Processing Unit)较适合解决海量数据的并行计算问题,是当前除云计算平台之外的另一项重要的高性能并行运算技术。文章分析了GPU并行运算、CUDA技术和SMO(Sequential Minimal Optimization)算法的基本原理,并将上述技术相结合提出了一种基于CUDA+SMO的大数据并行学习方案(CUDA-SMO),并与传统基于CPU的SMO学习方案(CPU-SMO)进行对比。实验结果表明,CUDA-SMO方案与传统CPU-SMO方案相比具有相近的学习精度,但CUDA-SMO却大大提高了学习速度。CUDA-SMO方案大大提高了大数据挖掘的效率,是未来机器学习和大数据分析技术发展的重要方向。
-
单位阳光学院