摘要

以提升挖掘分析铁路物流配送频繁路径数据效率为目的,研究基于并行Apriori的铁路物流配送频繁路径挖掘算法,采用Fuzzy c-means算法聚类分析物流配送数据集,根据内部相似度将数据集分割出具有较高相似度的数据簇,利用改进Apriori算法挖掘分析各数据簇中包含的频繁模式获取各区域的物流频繁路径,通过分析合并物流频繁路径后生成各区域的频繁路径序列。借助Hadoop中的子项目Mahout和MapReduce实现Fuzzy c-means算法和改进Apriori算法的并行化。实验结果表明,上述算法有效提升频繁路径的挖掘效率以及精度,确保为物流管理者提供清晰的货物流向,在实际应用中具有更高适用性。