摘要

烟草零售环节积累了大量交易数据,但其中隐藏的有价值的信息还未被有效挖掘。本文针对某省烟草零售户卷烟进销存流水数据进行数据挖掘研究。在原始数据清洗和预处理之后,对于零售户分类中遇到的噪声数据,运用Kmeans算法进行聚类。对聚类中的噪声干扰,提出了离群点消除方法,将离群点划分到另外的Voronoi单元中,增强正常数据点的聚类有效性。该系统在营销实践过程中得以应用,证明了方法的有效性。

  • 单位
    重庆中烟工业有限责任公司

全文