摘要
随机森林算法在股票收益率分类预测中是个有效的机器学习算法,准确度高,但存在参数寻优缺陷和特征选择困难等问题。为此,在传统随机森林算法的基础上,将特征选择粒子群算法和参数网格搜索算法相结合,提出一种新算法——粒子群参数网格搜索的随机森林算法。用粒子群算法对输入数据进行特征选择,通过剔除冗余特征来降低输入数据维度,并引入网格搜索算法来优化随机森林的一些参数,不仅降低了随机森林算法的计算复杂度,且提高了随机森林的分类预测准确度。文章采用沪深300和中证500股票历史数据进行仿真,相比随机森林算法和网格算法优化的随机森林算法,改进的新算法其分类精确度显著提高,沪深300预测准确率达到86.3%,中证500预测准确率达到87.6%。
- 单位