为了利用决策树分类算法解决大规模数据集上的分类问题,提出了一种基于经典C4.5决策树算法的分布式算法,在Map-Reduce分布式计算系统框架下,利用分布式思想构造决策树节点,解决了数据量大和数据复杂度高导致分类时运行速度慢的问题。仿真结果表明,与经典C4.5算法相比,该分布式算法具有较高的分类准确率及较好的speedup、scaleup和sizeup性能。