摘要

为提高电话中心通话量的预测效果,提高模型预测的召回率、精度、F值,使用基于多个决策树的随机森林模型和Bagging方式组合,通过多个弱分类器,最后汇总。随机森林在Spark数据引擎中易于并行化。Spark的特点比MapReduce数据引擎更适合做迭代运算和交互式挖掘。将平安科技电话中心通话量的预测精度提高了5%。研究结果表明,基于Bagging组合的随机森林算法会提升数值型模型预测的效果。

全文