短文本聚类研究广泛应用在不同领域,而短文本呈现的稀疏性、歧义与噪声多的特点,要求聚类处理过程中短文本的向量表示能够充分编码其有效特征,本文从短文本聚类的两个关键步骤,即文本的向量化表示与聚类效果评价进行研究。据此对短文本聚类方法的演化过程与优化方法进行了总结,并针对现有研究对未来的发展方向进行展望。