基于Synonyms、k-means的短文本聚类算法

作者:回玥婷; 夏懿嘉; 陈紫荷; 佟鑫
来源:电脑知识与技术, 2019, 15(01): 5-6.
DOI:10.14004/j.cnki.ckt.2019.0003

摘要

当今社会,网络搜索成为人们获取资讯的主流。短文本因特征信息不足且高维稀疏等特点,导致传统文本聚类算法应用于短文本聚类时效率低下。为此,我们采用为关键词以及k-means和synonyms相结合的方法,提高主题归类精确度。实验证明,我们提出的s-k(Synonyms-k-means)主题聚类算法不仅有效归类主题,而且能挖掘出词语的潜在含义。

全文