基于词向量的npm包推荐标签方法

作者:孙凯; 刘宣彤; 张莉*; 刘华虓; 王禹; 郜山权
来源:吉林大学学报(理学版), 2022, 60(05): 1097-1102.
DOI:10.13413/j.cnki.jdxblxb.2021222

摘要

针对开源npm(node package manager)社区标签机制不完善的问题,提出一种自动为开源第三方库npm包推荐标签的方法.首先,根据npm社区中现有标签间的关联关系对标签聚类,在解决标签同义词问题的同时建立标签库;其次,利用词向量技术计算npm包的Readme文档与标签库中标签的语义相关程度;最后,根据相关程度对标签进行排序,生成标签推荐列表并完成标签推荐.实验结果表明,该方法可有效地为npm包推荐标签,准确率Recall@3为49.1%, Recall@5为56.3%, Recall@10为66.9%.

  • 单位
    吉林大学; 外交学院; 白城医学高等专科学校

全文