摘要

针对电信客户流失模型的构建,提出了基于不均衡数据处理与组合模型相结合的集成方法。按固定比例同时对数据集中多数类样本和少数类样本抽样,形成一个新的子数据集,重复该过程并训练多个基分类器;将基分类器进行线性组合,利用Lagrange函数求解组合模型的系数。利用某企业宽带客户行为数据训练模型,进行隔月预测。实验结果表明:该方法相对于各单模型,在F1值和对少数类的预测命中率上分别提升了2.3%和2.1%,可以帮助企业制定挽留方案。