摘要

核主成分分析法作为一种非线性数据处理方法,被广泛应用于数据降维。文章将核主成分分析法应用于中文文本分类领域,使用核主成分分析法对酒店评论数据集进行特征提取。然后,基于核主成分分析法降维后的数据,对比极端梯度提升算法和逻辑回归算法的文本分类效果。实验结果表明,核主成分分析法能够有效去除数据冗余,提升中文文本分类的准确率和查全率。相较于极端梯度提升算法,逻辑回归算法在训练集和测试集上的分类准确率差距不大,模型的泛化能力较好。

  • 单位
    菏泽医学专科学校

全文