摘要

现有分类算法在处理大数据时计算时间往往过长,从而使得其性能难以满足大数据应用的实际需求。为此,该文研究了一种基于云计算框架的SPRINT优化分类算法,其思路是构建一种三层次的云计算框架,将优化的SPRINT分类算法植入其中,使得在处理大数据过程中SPRINT分类算法具有更好的稳定性和通信效率以及更高性能的并行计算环境。SPRINT分类算法的优化方法是:首先,利用GiNi值节点的分割提升连续属性的优化能力和分类算法并行计算能力,然后,重新划分大数据集的子集,并依据最佳分割点完成决策树的构建,提升大数据分类处理能力。实验结果表明,云计算框架下优化SPRINT分类算法具有更好的分类性能和分类效率,算法的并行性能和执行速率也优于传统大数据分类算法。

  • 单位
    宁波城市职业技术学院

全文