摘要

本文针对中文文本分类的特点,采用中科院汉语词法分析系统ICTCLAS对文档进行分词,并进行数据清洗和过滤停用词,运用信息增益和文档频率特征选择算法对文档进行特征选取。

  • 单位
    泸州职业技术学院