基于Map/Reduce集群上的模式空间划分的序列模式挖掘

刘骞; 陈明

摘要

通过模式空间划分将基于Map/Reduce处理数据集与候选序列模式集的多对多的对应关系的问题转化为处理数据集与以频繁1-序列为基的各子模式空间的多对多的对应关系问题,大大缩小了中间结果键值对集合的规模,避免了由于组合爆炸导致的单一Map节点的瓶颈问题.通过三轮的Map/Reduce任务,实现了模式空间和过滤规则的建立,并在此基础上实现了各子模式空间上独立地进行序列模式的挖掘.通过充分利用整个模式空间的全局特征及各子模式空间的个性特征,设计了优化的非递归挖掘算法,减少了前缀投影库构造次数及对构造的投影库的扫描次数,从而提高了挖掘阶段的效率.

收藏分享被引浏览

更新时间：2017-04-29 02:52

基于Map/Reduce集群上的模式空间划分的序列模式挖掘

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友