摘要

【目的】挖掘在线预订平台评论中的观点原因,提出一个观点原因句分类模型(DERNIE-BiLSTM)。【方法】构建一个数据量百万级别的酒店领域评论语料库并人工标注一个数据集ORSC,将语料库额外加入ERNIE自有的预训练集中并通过预训练提取ORSC数据集的文本特征,利用BiLSTM模型融合特征并识别包含观点原因的评论。【结果】在ORSC数据集上,DERNIE短分类准确率为0.913 3,F1值为0.912 0;经过BiLSTM融合特征后的准确率提升到0.945 7,F1值提升到0.946 2。【局限】预训练语言模型需要大量的训练语料,对计算速度和效率会产生一定影响。【结论】DERNIE-BiLSTM预训练模型的特征提取和融合方法,能更精准地挖掘评论中的观点原因句。