摘要

数据质量是影响开放数据价值生成的关键因素。本文采用网络调查和数据分析方法,对13个开放数据平台中的数千个数据集进行分析,归纳出29类"脏数据",统计了北京、上海和哈尔滨三地的数据质量问题分布情况。文章建议在引进"数据清洗"和"质量检查"环节、采用标准规范等方面借鉴先进经验,提升和保障数据质量。