摘要
提出一种改进堆叠泛化(stacking)算法的电信套餐预测方法。该方法将多种套餐进行两层分类,第一层粗分为高低价值两种套餐,第二层在粗分基础上对高价值或低价值套餐进行细分,在每一层数据预处理阶段使用合成少数类过采样算法(synthetic minority oversampling technique,SMOTE)得到平衡数据集。采用改进堆叠泛化算法,对每一类取所有0层分类器的最大最小后验概率,并融合重要的消费信息作为1层训练集,由1层分类器预测套餐的种类。选取某公司6种电信套餐进行预测,实验结果表明,改进后的套餐预测模型可应用于多种不平衡套餐的预测。
-
单位通信与信息工程学院; 西安邮电大学