资源发现系统中基于多源数据融合的文献元数据质量提升

林鑫; 李想; 李静

摘要

[目的/意义]构建面向多源文献元数据的数据融合模型，以提升发现系统中元数据的质量，进而为用户体验良好的文献发现服务组织奠定数据基础。[方法/过程]首先分析文献元数据存在的代表性质量问题及成因，在此基础上构建多源文献元数据融合模型，包括元数据著录规则及质量分析、数据预处理、基于多元数据项的数据判重、元数据内容融合策略体系，最后通过实验验证模型效果。[结果/结论]实验表明，模型在元数据判重环节的准确率和召回率分别达到99.9%和99.2%，均高于对照组；完成元数据内容融合后，题名、作者、摘要、页码等元数据项的质量均有明显提升。

单位
华中师范大学

收藏分享被引浏览

更新时间：2021-07-05 18:29

资源发现系统中基于多源数据融合的文献元数据质量提升

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友