摘要

分析了传统朴素贝叶斯算法、TFIDF特征加权算法在文本分类建模应用上的缺陷,在此基础上提出了TFIDF的优化算法,并分别采用传统朴素贝叶斯算法、基于TFIDF的朴素贝叶斯算法、基于改进TFIDF的朴素贝叶斯算法分别对某供电公司投诉工单进行了分类建模。研究结果表明,改进TFIDF算法能在TFIDF算法的基础上进一步提升分类器的性能,投诉工单分类准确率达到93.03%,较传统朴素贝叶斯算法提升了4个百分点。