摘要

[目的/意义]构建面向多源文献元数据的数据融合模型,以提升发现系统中元数据的质量,进而为用户体验良好的文献发现服务组织奠定数据基础。[方法/过程]首先分析文献元数据存在的代表性质量问题及成因,在此基础上构建多源文献元数据融合模型,包括元数据著录规则及质量分析、数据预处理、基于多元数据项的数据判重、元数据内容融合策略体系,最后通过实验验证模型效果。[结果/结论]实验表明,模型在元数据判重环节的准确率和召回率分别达到99.9%和99.2%,均高于对照组;完成元数据内容融合后,题名、作者、摘要、页码等元数据项的质量均有明显提升。