近年来,随着不断增强的互联网技术创新能力,当前以电脑为核心的但以互联网逐渐转向覆盖智能化终端的多元化互联网。互联网信息传播需要借助文本,然后文本字数较多,出现了稀疏性和上下文过于依赖等现象。本文则基于LDA(隐含狄列克雷分配)模型的短文本分类方法,利用模型生成的主题区分相同词的上下文和联系不同词,以减少稀疏性,增加权重,达到自动对短文本结构化分类的效果。