摘要
本文通过在线健康社区中对用户画像构建及主题特征挖掘,揭示不同用户角色群体下用户行为差异及特征,以了解社区内用户信息需求,为推动在线健康社区行业发展与完善提供建议。利用Python爬虫获取医享网中结直肠癌圈的用户数据,从用户角色属性、行为属性以及文本特征构建典型用户识别指标,利用典型用户识别指标与主题分类体系,将用户群体分为四类构建画像概念模型;再利用用户行为识别算法与主题聚类算法进一步挖掘不同角色下用户关注主题内容,实现用户信息需求的精准分析。本文通过挖掘分析四类用户角色在性别、年龄以及主题分布差异可以得出,不同用户群体信息需求具有显著差异。
-
单位南京大学; 南京审计大学