摘要
开放仓储目录是对开放仓储的描述说明和索引,是开放学术资源利用、发现、共享的基础。本文首先通过对OpenDOAR、ROAR、BASE等5个国际主流开放仓储目录的建设现状进行调研分析,发现在国际开放仓储目录建设方面,还存在仓储目录收录不够完整、目录元数据项不够丰富、目录更新时效性有待提高、揭示系统功能相对单一等不足。在此基础上,本文提出开放仓储目录元数据整合研究,包括元数据描述规范设计、基于OAI协议和ETL工具收割元数据,使用数据清洗工具OpenRefine对元数据进行“形式去重”和OAI-Identify获取结果的“内容去重”,并建立对多源异构仓储目录进行匹配融合的方法路径,形成数据内容更丰富、数量更加全面的全球开放仓储目录GOAR核心集和扩展集。最后从建立动态更新融合机制、常态化监控机制和目录发布系统三方面提出下一步研究方向。
- 单位