摘要

针对传统主题模型在无监督条件下生成的主题粒度问题,提出一种基于深度学习的细粒度主题建模方法,利用深度学习方法与LDA模型进行结合从而获得更细粒度的主题。首先针对文本分类问题提出一种ATT-TCNN的文本分类模型,该模型可以有效对带有标记信息的语料库进行文本分类。再利用ATT-TCNN与LDA进行结合形成ATT-TCNN-LDA模型,将每个分类结果作为模型输入并形成各个主题簇,从而达到细粒度主题建模。通过实验表明,分类方法和主题建模方法相对于其他方法具有较好的效果。