中文文本分类模型对比研究

作者:陈海红; 司威; 黄凤坡
来源:赤峰学院学报(自然科学版), 2023, 39(01): 12-15.
DOI:10.13398/j.cnki.issn1673-260x.2023.01.019

摘要

文本分类是自然语言处理领域的一个重要研究课题。采用基于情感词典的分类方法,即SnowNLP库、逻辑回归、全连接神经网络、LSTM、BERT模型等多种方法对文本进行分类研究,发现BERT模型达到了最高的准确率和最低的loss,基于词典的匹配方法思路简单,但由于语义表达的丰富性而出现很大的误差,基于TF-IDF的逻辑回归具有不错的效果,总体来讲深度学习的方法精确度更高。

  • 单位
    赤峰学院

全文