摘要

为探讨数据治理工作在既定规范下取得相同或相近质量成果的可能性,尝试提升数据治理手段和工具的智能化与自动化,以某高等学校在中文期刊发表论文数据治理工作实践为例,使用Python编写程序自动挖掘从中国知网下载的题录及PDF文档内容,实现署名作者身份甄别、业绩点核算、文章所属期刊被各类评价体系收录情况统计等工作.结果表明,所编写程序自动化程度高,基本达到预期效果,在数据治理工作尚无成熟统一的大平台支撑背景下,编写个性化数据治理工具大有可为.