摘要
针对现代文化研究中对精确化文本情感分析的需求,文中对自然语言处理(NLP)中的词向量生成与训练方法进行了深入研究。通过采用层次Sotfmax结构,减轻了词向量描述时随着向量维度的增长而引发的矩阵稀疏问题。在该结构的输出层引入负抽样方法,节省训练时间;同时,使用深度卷积神经网络替代该模型中原有的二叉树结构,提升模型的泛化能力。使用SemEval2013进行模型仿真实验,结果表明,在进行英文文本的情感分析时,模型对于表示否定的情感倾向有较优的识别精度;而对于中性的文本识别精度较差。文中提出的CNN-Softmax模型由于引入更深层次的卷积结构,在性能上有了显著提升,Accuracy与F1分别达到了84.3%和82.3%,相较于传统基于二叉树的模型提高了约5%。
- 单位