摘要

从客户信息多维考虑,结合K-means算法原有思想,通过多维聚合来实现对大量客户信息的分类聚合,通过比较数据伸缩率及扩展率来比较了Hadoop上的性能。