摘要

对微博用户进行合理的分类有助于理解特定网络社群的行为,为之提供多元化的网络服务。通过用户的自我标签和对历史微博进行分词获取主题标签,摈弃权值较低的主题标签,然后结合用户自我标签与话题标签提取带权值的用户标签,计算用户相似度构造一个无向图。最后,应用基于滑动窗口的多标记传播算法对无向图进行社区划分。滑动窗口可以存放多个标记,从而一个用户可以归属于多个类别。通过新浪微博爬取的真实数据进行实验,结果表明该方法能有效发现具有重叠划分的簇,且簇的意义比较明确。

  • 单位
    金陵科技学院