基于词共现的文本分类算法

作者:和志强; 杨建; 王丽鹏
来源:河北省科学院学报, 2018, 35(03): 1-6.
DOI:10.16191/j.cnki.hbkx.2018.03.001

摘要

特征词提取算法大多以选取单个关键词为主,存在词与词关联度缺失,文本主题表达不准确的问题,为此提出一种基于词共现的文本分类算法。通过计算词间共现率,利用TextRank算法构建共现图得到共现词组,建立文本向量表示模型,并利用SVM算法实现文本分类。实验证明,共现词作为文本特征项相对于传统单个特征词有更好的分类效果。

  • 单位
    河北经贸大学

全文