摘要

随着网络用户的日益增多,许多互联网企业甚至事业部门需要使用用户画像来对不同网络用户进行心理刻画来了解用户。但用户画像算法一般存在着聚类算法的簇值必须手动指定以及无效关键字过多的问题。因此文章设计了一种新的基于网络行为的用户画像方法。该方法首先会对搜集到的用户数据进行分类;接着设计算法自动确定簇值,并将簇值代入聚类算法与分类算法后执行它们,从而在数据中提取关键字;之后使用分词算法进行标签的生成,并利用停用词过滤和关键字补遗机制来去除无效关键字;最后,使用词云算法生成用户画像文件。在采集不同用户的网络数据进行实验后,结果表明文章改进后的用户算法成功简化了聚类步骤,且无效关键字显著减少,用户画像能够更加精准地描述用户特征。