摘要

为提高数据挖掘处理效率,提出一种基于单位层次树的归并计算方法。以装备维修保障相关数据为例,建立叶子节点的自下而上逐层归并计算模型,对MapReduce并行计算模型进行改进,采用完全分布式模式实现HadoopMap/Reduce分布式处理架构,实现面向单位层次树的属性约简与数据归并,对MapReduce分布式模型的加速比和可扩展性进行分析。结果表明:该方法取得了较好的效果,具有一定理论价值。

  • 单位
    中国人民解放军装甲兵工程学院