大数据时代数据融合质量的评价模型

作者:李红; 牛成英; 孙秋碧; 林嘉燕
来源:统计与决策, 2018, 34(21): 10-14.
DOI:10.13546/j.cnki.tjyjc.2018.21.002

摘要

多方主体参与、多种手段并存的数据采集、数据汇聚离不开数据融合。但基于遥感、互联网信息、问卷调查等数据收集方式的变化,使得大数据融合质量评价问题变得更为困难。文章基于对数线性与双系统估计方法建立数据融合质量评价模型,并以两个数据库的融合为例,深入分析数据融合中过涵盖误差估计方法。基于对数线性与双系统估计方法的数据融合质量评价模型中,一个只包含不足涵盖误差的抽样调查是必须的,并且该质量评价模型可扩展至多个数据库融合的情形。该模型易于操作,能为数据整合汇聚、建立大数据云和重点领域专题数据库提供质量保证。

全文