随着微博用户的增长,微博文本量也呈现出爆发式的增长趋势。面对如此海量的文本数据,如何有效地检索有用的信息对微博用户是十分重要的。本文采用基于TF-IDF计算,先找到关于词频相似的微博文章;然后利用LDA主题模型的方法,筛选出主题内容相似的微博文章。实验结果证明,采用该综合检索方法,用户能够检索出更加符合用户实际需求微博文章。