基于BERT和RNN的新闻文本分类对比

作者:林德萍; 汪红娟
来源:北京印刷学院学报, 2021, 29(11): 156-162.
DOI:10.19461/j.cnki.1004-8626.2021.11.044

摘要

准确且高效地获取对我们有用的信息,解决数据信息过多而带来的数据冗余的问题成为人们越来越关注的问题。近年来国内外研究学者针对不同的自然语言处理任务提出了各种不同的框架,不同的框架具有不同的优缺点。自然语言处理领域中经典的问题之一就是文本分类,其中新闻文本分类是我们日常生活中容易引起大家关注的重要任务。该实验基于Transformer框架下的BERT模型对新闻文本数据集进行分类,通过与RNN的长短期记忆网络对同一新闻文本数据集进行了对比,评价指标采用的是模型分类通用的准确率和损失值。实验结果表明BERT模型的分类准确率明显高于长短期记忆网络。

  • 单位
    北京印刷学院