摘要

文本分类是自然语言处理中的一项重要任务,用计算机做文本分类能够大大提高文本分类效率,方便人们的生活,该文主要介绍如何用支持向量机做文本分类。该文前面主要介绍文本分类背景、意义和应用,之后对中文分词、文档建模、分类器训练和评估原理做了重点介绍,包括了自然语言处理中的统计语言模型,机器学习中的SVM算法、NNLM模型。