摘要

针对互联网时代面临的通过人工对海量新闻进行分类较为困难的问题,本文通过贝叶斯、RidgeClassifier和fastText这三种分类器进行新闻文本分类,分析比较了这三种分类器对新闻文本分类的效果。实验结果表明,三种分类器均可以实现新闻文本分类的任务,其中fastText方法在匿名新闻文本分类问题中各方面性能指标最优,本文从算法理论上分析了产生这一差异的原因。