基于向量空间的文本聚类算法

高强

doi:10.19353/j.cnki.dzsj.2017.20.027

登录

免费注册

赞收藏引用

科研之友

微信

新浪微博

Facebook

分享链接

基于向量空间的文本聚类算法

作者：高强

来源：电子世界, 2017, (20): 61-62.

DOI：10.19353/j.cnki.dzsj.2017.20.027

摘要

聚类是一种非监督学习,以k-means为例,簇心的选取是个非常随机的过程,导致k值相同的情况下聚类的结果每次都不一样,又不好取个平均,所以聚类的好坏很难被评价出来。文本聚类是将一个个文档由原有的自然语言文字信息转化成数学信息,以向量空间点的形式展现出来,通过计算那些点距离比较近来将那些点聚成一个簇,簇的中心叫做簇心。一个好的聚类要保证簇内点的距离尽量的近,但簇与簇之间的点要尽量的远。通过对数字信息的聚类,使所代表的文本内容产生分类的结果,并能一定程度的保证文本聚类结果的精度。

单位
山东青年政治学院

全文

访问全文

收藏分享被引浏览

更新时间：2024-05-11 09:47

相似论文
引用论文
参考文献

产品服务

科研之友科研之友机构版科创云

站内浏览

科研成果科研人员科研机构

服务支持

帮助中心隐私政策服务条款

联系方式

在线客服：【立即咨询】客户热线：400-1616-289 电子邮箱：support@scholarmate.com

微信公众号