基于深度学习和主题模型的短文本分类方法

王青松; 聂振业; 周芳晔

doi:10.16197/j.cnki.lnunse.2022.02.001

摘要

为了解决短文本的语义稀疏和特征信息难以提取问题，本文提出了一种基于深度学习的短文本分类方法.首先通过增加自注意机制的双向BiLSTM通道获取短文本特征词向量，引入外部CN-DBpedia知识库KBs来深度挖掘短文本语义，解决语义稀疏问题.其次通过BTM主题模型在短文本数据集上提取主体信息，为了得到准确的词向量拼接引入了超参数δ.最终将所得的特征词向量以及知识向量运用语义余弦相似度计算并拼接向量，将得到的拼接结果与主题信息通过Softmax分类器中进行分类.在中国微博情感分析数据集、产品评价数据集、中文新闻标题数据集、Sogou新闻数据集上进行实验.与TextCNN、TextRNN、TextRNN＿Att、BiLSTM-MP、KPCNN算法相比，分类准确性有一定提高.

单位
辽宁大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-19 14:47

基于深度学习和主题模型的短文本分类方法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友