摘要

包含丰富种类衍生变量的股票数据有利于更全面地分析市场变化,但其同时包含连续和离散数据,难以充分利用,并且高维数据的训练效率不高,且各维度之间存在不同程度的相关性,使得机器学习预测的效果欠佳。对此,研究提出了一种两阶段降维方法,通过结合无监督和有监督降维,在除去冗余特征、降低特征间相关性的同时,可以有效地将离散数据融入连续数据,将降维结果作为时变数据通过长短期记忆神经网络(Long Short-term Memory, LSTM)进行分析预测。实验结果证明,预测模型在预测精度、鲁棒性和回测收益方面相比于传统方法,均得到了提高。