摘要

近年来,随着人类进入大数据时代,整个社交媒体平台产生的文本数量呈爆炸式增长。由于海量的中文文本本身存在稀疏性和高维性特点,其语义解释也具有多样性和较强的语境依赖性,这无疑增加了对中文文本准确分类任务的难度。如何利用计算机对海量文本信息进行准确的分类,已成为当前研究的热门。本文通过实验对比BERT模型、BERT-LSTM模型和BERT-CNN模型在微博文本情感分类中的表现,实验结果表明,BERT-CNN模型分类效果最佳,其准确率比单一的BERT模型提高0.26%。

  • 单位
    国家计算机网络应急技术处理协调中心; 燕山大学