摘要

文章从科技领域的元数据建设与应用角度出发,首先在总结分析面向科技大数据的元数据建设研究成果和实践案例的基础上,提出了目前元数据建设存在的标准不统一、规范难度大、缺乏关联等问题。然后详细介绍了科技大数据领域元数据仓储建设的目标、具体流程,并且构建了覆盖10亿条科研产出、科研管理的元数据仓储数据库。最后以中文科技期刊论文元数据为例,介绍了元数据仓储建设的具体实现方法,提出一种改进的记录链接方法,并从数据质量和效率两方面验证元数据仓储建设的成果。