摘要
针对现有基于数据挖掘的文件关联性复制算法无法有效提取文件关联性的问题,提出了基于极大频繁关联模式挖掘的分散群复制算法(Decentralized Replication strategy based on Maximal Frequent Correlated Patterns,DRMFCP)。DRMFCP算法通过二进制历史文件转换、极大频繁关联模式挖掘和复制,以实现极大减少复制模式数量、消除冗余以及优化复制的目的。数据分析与仿真结果表明,在不同存取模式下相较于无复制、DR2、PRA和PDDRA算法,DRMFCP算法提取文件关联性的效率更高,并能同时降低作业执行平均时间,为降低网格数据传输延迟提供新的解决方案。
-
单位哈尔滨工业大学深圳研究生院; 黑龙江大学; 电子工程学院