为分析预测电商企业客户的购买偏好及其对应的商品特性表征,结合K-means与PCA来生成相对应且可解释的商品与客户集群,并将原始数据转换为可用于偏好预测分类器训练的数据。在此基础之上,进一步提出使用Stacking集成学习方法,提高预测准确性与模型泛化能力。研究以某公司的真实客户购买数据来验证所提方法的有效性,实验结果表明,基于购买数据正确地生成了5类商品聚类簇与11类客户聚类簇,并且提高了预测精度,以81.37%的准确率预测出了客户的偏好类别。