摘要

为了从大规模数据集中更高效地发现有价值的规则,本文提出一种迭代的频繁内嵌无序树模式挖掘算法:TETPM.同时设计了两个工作负载划分策略:TETPM-P和TETPM-E. TETPM-P由模式划分工作负载,而TETPM-E则通过模式实例来划分工作负载.实验评估表明,两种算法均可以有效地从大型数据集中挖掘频繁内嵌模式,TETPM-P适合于模式实例数更均衡的数据集,而TETPM-E则更适合规模更大的数据集.

全文