摘要

文章以中国知网2000—2018年“图书情报与数字图书馆”领域内的硕士研究生为样本对象,抓取每个样本对象在CNKI数据库的发文情况,经过数据预处理后从用户维度和行为维度搭建用户画像标签数据集,运用RFM模型、词云分析、K-means算法将样本对象聚合成四类:低价值群体、重要挽留群体、重要发展群体、高价值群体,并结合群体的潜在科研需求和发文偏好,识别核心学术用户,提供差异化的科研发展策略。