摘要
本文研究了数据挖掘聚类分析算法K-means与关联规则算法Apriori,针对两种算法存在的不足,根据购物用户的属性特征等有关信息,提出了一种基于K-means凝聚层次算法以实现对在线购物系统事务数据库进行聚类及压缩,并对聚类后的事务数据库,利用矩阵以及字典构建候选集及频繁项集,从而有效减少了事务数据库中的无用数据,降低了扫描事务数据库的次数,提高了算法的执行效率。
-
单位启明信息技术股份有限公司; 吉林建筑大学城建学院