摘要

针对主题模型在文本分类过程中的作用日渐凸显且最早应用于图像领域的WAE模型迁移到自然语言处理领域的应用过程中存在着一些“缺陷”,在WAE模型基础上进行了改进和优化,重点提出了GMWAE和DWAE两种改进模型,并将其与SVM结合起来进行中文的文本分类。在文本分类的研究过程中,进行了是否引入WAE、GMWAE、DWAE主题模型参与文本分类四种场景的搭建。通过实验表明,在SVM分类算法之前增加WAE、GMWAE及DWAE模型时,会在提升分类精度的同时减少分类的时间,其中改进后的模型GMWAE及DWAE表现均优于WAE模型,DWAE表现略佳。