摘要

提出一种基于文本聚类的开放式信息自动归类方法。它的主要特点是:适合自动归类不断增量的文档信息;不需要人为干预,完全靠自主学习的方式来确定各个主题的内涵范围;类别在聚类过程中动态产生。实验证明,该方法能实现增量信息的自动归类,且从评价函数的评价结果看,归类效果良好。