摘要

为改善文本评论的细粒度属性识别和情感分析的准确度,提出基于双向长短期记忆(Bi-LSTM)和条件随机场(CRF)的属性级情感分析框架.将评论句的属性项提取和情感极性分析建模为序列标注问题,提出新的标注方案,在完成属性项提取的同时确定情感极性.结合词性(POS)嵌入和词嵌入作为神经网络输入,并融合Bi-LSTM和CRF网络,利用Bi-LSTM高效捕捉两个方向的词语关联,并将结果输入CRF网络以得到特征函数与输出标签之间的条件分布,实现高质量特征提取和准确标签分配.实验结果表明,结合所提新标注方案后,Bi-LSTM和CRF网络具有互补性,融合网络性能显著优于单一网络.此外,所提方案在公开数据集上取得了与当前先进方法大致相当的性能,且在外部知识库不可用的在线学习评论数据集上,所提方法的情感分析准确度优于当前其他先进的深度学习方法和学习评论分析方法,具有较好的应用价值.