针对微博划分的草根用户与大V用户两个群体。通过LDA主题模型对用户的微博语料进行训练,分别得出两类用户微博关注的主题分布,从而分析其中的差异和交集。利用训练的主题模型结果,使用分类算法进行新输入文档的主题分布判断。