摘要

为了提高电子商务中的用户购买行为预测的效果,提出数据平衡与模型融合的方法来对用户购买行为进行预测。在对用户行为数据提取特征时发现数据样本类别存在严重不平衡的情况,针对这一问题运用改进的欠采样平衡方法处理用户行为数据,运用基于极端梯度提升(XGBoost)算法的融合模型对用户购买行为进行预测。以京东商城的交易数据作为实验数据集,通过与单一预测模型的对比实验证明了在预测精度和泛化能力方面融合模型相较于单一预测模型的表现都更好。