机器学习下的新冠疫情新闻文本分类

作者:李海艳; 王文东*; 江丛君
来源:延安大学学报(自然科学版), 2023, 42(01): 79-82.
DOI:10.13876/J.cnki.ydnse.220054

摘要

针对新冠疫情新闻繁杂及信息类别不明等问题,采取新冠疫情新闻语料作为数据集,分别利用TF-IDF与Word2vec提取特征值,与支持向量机、朴素贝叶斯等基于机器学习的模型结合对文本进行分类,并与TextCNN及BiLSTM 2种深度学习模型的分类实验结果进行对比分析。实验结果表明:同等条件下,基于新冠疫情主题新闻数据集,SVM+TF-IDF模型在几种分类器中效果最好,精确度达到84%,F1值达到83%。

全文