在信息数据爆炸式增长的今天,各类信息如潮水般呈现在人们面前,利用文本分类技术可以高效、准确地找到人们需要的有关分类信息,为进一步开展数据挖掘和分析奠定基础。文章的标题、摘要是内容的高度概括,针对这些短文本进行分类则成为自动文本分类的研究方向。基于互联网信息平台各类信息数据,文章分别采用Bow和TF-IDF等技术方法进行文本向量化,构建多项式朴素贝叶斯模型对训练集数据进行训练,并对比研究测试集预测结果,实现短文本自动文本分类,为实现快速获取某类信息热点提供参考。