短文本聚类方法研究综述

作者:和志强; 王梦雪; 马宁; 陈萌
来源:河北省科学院学报, 2021, 38(05): 34-40.
DOI:10.16191/j.cnki.hbkx.2021.05.007

摘要

短文本聚类研究广泛应用在不同领域,而短文本呈现的稀疏性、歧义与噪声多的特点,要求聚类处理过程中短文本的向量表示能够充分编码其有效特征,本文从短文本聚类的两个关键步骤,即文本的向量化表示与聚类效果评价进行研究。据此对短文本聚类方法的演化过程与优化方法进行了总结,并针对现有研究对未来的发展方向进行展望。

  • 单位
    河北经贸大学