摘要
随着信息技术的飞速发展,各级政府和大型企业掌握的数据量正在以指数级别增长。然而,数据来源多样会导致格式差异,数据质量参差会影响应用效果,数据分散管理会弱化关联汇集,数据形态异构会造成语义鸿沟。在此背景下,多源异构数据融合,负责将来源不同的多模态数据进行有效整合,完成数据互补与关联,进而实现信息增强。目前,大多数已有研究的关注重点集中在大数据治理流程与多模态深度学习,很少有工作研究讨论完整的多源异构数据融合技术框架。因此,在综述关键技术基础上,本文提出了一整套涵盖“数据引接--数据清洗--数据集成—数据融合”全过程的多源异构数据融合关键技术框架,并对各个环节的需解决问题与重点任务进行介绍。然后,通过一个政务应用实例场景,给出了政务大数据治理体系的设计,以解决政务数据来源广泛、质量参差、管理分散、形态异构的问题,并进一步阐述多源异构数据融合的重要价值。最后,对全文进行总结与展望。
-
单位国家信息中心; 北京交通大学