摘要

当前的电商零售数据受到很多因素的影响,其内在联系属性被众多不相干非销售数据属性干扰。销售数据的关联规则很难被无差错的找到,传统的关联挖掘算法会陷入到海量的数据联系中,形成很多无用联系,造成挖掘耗时,效率较低。提出一种多维cube的海量零售关键数据挖掘模型。依据频繁项目集的性质,按照概率估算方法,将扫描的待定项目集进行选择性评估;在频繁项集的时候,根据评估的概率按照候选项目集的依赖关系进行筛检,并结合最小支持度与最小可信度的阈值产生频繁项集,进一步产生关联规则。以某电子商务网站中的销售数据和客户访问数据仿真结果表明:改进算法具有较好的访问速度,验证了算法的有效性。