融合多维特征的学术文献下载行为预测研究

作者:谢豪; 吴雪华; 陈茜; 唐晶; 白云; 毛进
来源:图书情报工作, 2021, 65(12): 112-121.
DOI:10.13266/j.issn.0252-3116.2021.12.011

摘要

[目的/意义]学术文献下载行为是科研人员文献检索行为的重要一环,对其预测的研究有助于深度理解科研人员检索行为,为学术资源检索平台优化检索结果、重构排序提供依据,从而提升检索系统的服务质量。[方法/过程]构建用户学术文献下载行为的多维特征体系,在机器学习算法基础上构造基于查询相关性和基于用户行为的子分类器,并采取加权策略构建学术文献下载行为预测混合模型。[结果/结论]实验结果表明,随机森林算法在两种分类器上均取得最佳性能;相较于仅基于查询相关性特征训练的模型,混合模型的准确率提高了2.3%,F1值提升了1.3%。在混合模型中,基于用户行为的子分类器拥有更高权重;"下载量""是否采用专业/高级检索"和"发表时间"特征的贡献度较大。

全文