摘要
[目的/意义]通过密度峰值聚类算法(DPCA)对社会化问答社区用户生成答案进行知识聚合与主题发现。[方法/过程]利用TextRank方法挖掘用户生成答案中的关键词集合,再利用DPCA对关键词集合进行凝聚,最后进行可视化词云展示。[结果/结论]与传统聚类算法对比,DPCA能获得更加准确的聚类数目,簇类内的关键词更加凝练,知识主题更加明确。文章通过聚合服务,自动化地发现社会化问答社区中的知识主题,进一步提高了社会化问答社区中的用户交流方式和知识服务水平。[局限]用户生成答案缺少标准实验参考集,聚类结果测度有待完善。
- 单位