摘要

论坛流量预测对网络规划、舆情管理等任务具有重要意义,针对线性预测模型无法预测非线性关系、非线性预测模型的特征工程过于复杂的问题,利用历史时间序列作为特征,建立一种基于不同算法的集成模型以预测论坛发帖量。运用差分自回归移动平均、长短期记忆神经网络、Prophet以及梯度提升决策树4种模型分别对时间序列进行预测,参照加权投票法的思想,各模型投票选出时间序列单位下密度较大的预测值区间,依据各模型预测值所处区间的密度大小对各预测值进行权重分配,然后通过加权平均得到最终的预测结果。实验结果表明,与算术平均模型、基于均方根误差的加权平均模型相比,该模型预测结果的RMSE值以及相对误差值更小。