摘要

本发明公开了一种基于多尺度循环神经网络的金融舆情分析方法,包括以下步骤:获取金融文本数据,对数据进行预处理;使用滑动窗口对预处理后的金融文本数据采样得到每个时间步的子序列,将子序列输入组循环神经网络提取文本序列的局部特征表示,通过最大池化操作得到文本序列的显著性特征表示;使用多个不同尺度的滑动窗口提取文本序列不同的显著性特征表示,最后拼接得到序列的多尺度特征表示;将多尺度特征表示输入全连接层和softmax层进行分类。本发明使用不同尺度大小的滑动窗口采样文本子序列,通过组循环神经网络建模不同尺度的局部短语特征,将不同尺度特征融合得到文本的语义特征,进一步提高金融舆情分析的准确率。