<正>本文主要从原理上介绍了两种文本聚类的算法——K-means和LDA。文章第一部分介绍了文本聚类的背景,包括定义、应用和意义;文章第二部分介绍了当前的研究背景以及研究热点;第三部分介绍了文本聚类的一般步骤,涉及到的技术有中文分词和聚类算法;最后一部分为总结展望。