基于BiLSTM-CNN模型的新闻文本分类

作者:龚维印; 韦旭勤
来源:电脑知识与技术, 2021, 17(21): 105-107.
DOI:10.14004/j.cnki.ckt.2021.2094

摘要

针对单一CNN网络在新闻文本分类中容易忽略上下文的语义信息,分类准确率低的问题,同时结合CNN和Bi LSTM的优点,提出一种基于Bi LSTM-CNN模型的新闻文本方法。该模型先使用Word2Vec中的Skip-gram模型对数据中的词进行映射处理,转换为固定维度的向量;再利用Bi LSTM捕捉双向的语义信息;最后将Bi LSTM模型提取的特征与词嵌入的特征进行拼接作为CNN的输入,使用大小为2,3,4的卷积核进行卷积。在THUCNews和Sougou CS两个公开的数据集上进行实验,实验结果表明,融合的BiLSTM-CNN模型在新闻文本分类效果上优于BiLSTM、CNN模型。

  • 单位
    六盘水师范学院

全文