摘要
数据质量是决定数据是否适用于预期用途的基础,尽管目前存在用于评估常规数据质量的不同数据质量模型,但它们都没有适应大数据。为填补这一空白,本文提出了特有的数据质量模型,该模型由三个数据质量特征组成,用于评估大数据项目中使用中的数据质量水平:分别是上下文充分性、操作充分性和时间的充足性。该模型可以集成到任何类型的大数据项目中,因为它独立于任何先决条件或技术,并且完成了针对大数据的数据质量计划的所有挑战。同时该模型可以作为获得大数据分析输入数据使用质量水平的适当方式,并且这些水平可以被理解为可信度和结果可靠性的指标。
- 单位