摘要

基于沪深300、中证500、中证全指从时间节点和因子暴露两个角度选择了相关因子,并进行了因子相关性分析,从多因子中筛选得到三组多因子组合,进行了回测对比。而后利用四种机器学习算法实证分析了各多因子组合在量化选股上的效果,并从持仓数、市场风格、参数等角度比较了各多因子组合之间的差异。最后对选股策略做了进一步优化。研究发现,构建的多因子量化选股策略具有较好的选股效果,支持向量机算法下的收益率表现最好。整体来看,随机森林算法下的收益率低于支持向量机,但其预测能力更好;岭回归算法和线性回归算法对选股策略的作用相似。随着因子数的增加,各种算法下的整体拟合度和收益率间呈现反向关系。