基于SELC模型的新闻文本分类方法

作者:秦硕; 郑虹*; 侯秀萍; 郑肇谦
来源:长春工业大学学报, 2022, 43(03): 265-270.
DOI:10.15923/j.cnki.cn22-1382/t.2022.3.12

摘要

中文长新闻文本的分类问题主要采用截断式提取方法,但是这种方法会大幅降低特征提取的准确性。针对以上问题,文中提出了在文本处理阶段对长文本新闻进行摘要抽取处理,这样既能保留源文本的特征信息,也能降低时间复杂度。使用ERNIE进行词向量表示,经过自注意力和卷积网络后提高分类任务的准确性。

全文