摘要
面对海量的文本信息,有效的存储与管理、快速和准确的分类从而提取有用信息成为了当前的一个研究方向。文本挖掘和信息检索的重要基础是自动化文本分类技术,朴素贝叶斯分类器是机器学习在文本自动化分类领域重要的一种分类器。朴素贝叶斯分类快速而精确,只需扫描一次数据集,具有较强的抗干扰能力。介绍了自动化文本分类的相关背景,论述了自动化文本分类技术的一般流程,设计和实现了一个基于朴素贝叶斯的自动化中文文本分类器,并通过两个实验对分类器进行了测试与验证。实验结果表明,该分类器具有良好的分类效果和分类速度。
-
单位山西工程职业技术学院