摘要

传统FP-growth历全局FP-tree造成极大浪费;并行处理时各节点之间需要的巨大通信开销等问题。针对传统FP-growth算法存在的这些问题展开研究,提出一种采用数据库分解思想,基于Hadoop FP-tree的挖掘算法。

全文