摘要
针对传统Stacking算法手动选择基学习器存在效率低和无法选择最优基学习器的问题,提出一种基于动态聚类的Stacking算法并将其应用于销量预测任务中。首先,通过轮廓系数法对多个初始基学习器的输出以不同的簇数计算其轮廓系数值;然后,动态选择系数值最大时的簇数进行k-means聚类,每轮聚类后根据各簇心与标签值的误差给予回报值奖励;最后,选择回报值最大的簇所包含的基学习器作为最优基学习器。实验结果表明,所提算法与基于特征融合的Stacking算法相比,均方根百分比误差(RMSPE)降低了1.3个百分点,平均绝对百分比误差(MAPE)降低了1.0个百分点;与基于层次分析的Stacking算法相比,RMSPE降低了1.1个百分点,MAPE降低了0.8个百分点。
-
单位中国科学院大学; 中国科学院成都计算机应用研究所