摘要
行为金融学理论指出,由社交媒体文本数据所折射出的投资者情绪在一定程度上影响着股票市场的波动。为了利用投资者情绪对股票市场作出更准确的预测,本文爬取2020年8月31日至2021年9月1日的沪深300指数股吧评论文本数据,使用基于融合基础情感词典和金融词典的分析方法将评论文本数据量化为投资者情绪指标,并利用长短期记忆(Long short-term memory,LSTM)神经网络构建了融合股票历史交易数据和基于股吧评论的投资者情绪指标的多特征预测模型。实验结果表明,基于数值和文本特征的LSTM股票价格预测模型的平均绝对误差(Mean absolute error,MAE)、均方根误差(Root mean squared error,RMSE)和均方误差(Mean square error,MSE)值较LSTM数值特征预测模型降低了18.84、15.79、1486.54。较GRU(Gated recurrent unit)数值文本特征模型,其MAE、RMSE、MSE值则降低了11.42、10.49、931.75。实验结果表明本文提出的方法可以有效预测股票价格指数。
-
单位山西财经大学