摘要

[目的/意义]文献检索中,特定账号可能以独享和共享的方式被使用。在理解用户信息需求确保个性化服务的精准性的问题上,首先要排除共享账号的群体所产生的各异行为对理解用户需求造成的干扰。因此,需要识别用户的行为边界,即某个账号的访问者是个体还是群体。[方法/过程]从科研用户的日志数据中提取行为习惯和主题偏好两方面特征,构建基于科研用户小数据和随机森林分类的个体用户识别模型,并以国家科技数字图书馆网站为例进行实证研究。[结果/结论]实验表明,提出的方法能够有效识别学术搜索日志中的个体用户,准确率约为92.9%,其中主题一致性是区别个体与群体科研用户的最重要特征。本研究不仅可以帮助识别个体用户和机构用户,优化用户管理,而且为跨设备的同一用户判定提供思路。