摘要

针对信息系统中海量数据多源异构和难以共享的问题,提出了多源异构数据虚拟集成框架.数据集成系统中的GAV(Global-As-View)模式映射方法面对信息量分布不均匀的数据源时,查询效率较低,在对GAV改进的基础上,提出了基于HGAV(Hierarchical-Global-As-view)的模式映射算法,通过引入中间数据源模式,形成分层的全局视图,大大缩减了映射空间,简化了映射集合,便于查询的重写和优化.利用宁东智慧环保项目中的五大类数据对本文所提出的算法加以验证,实验结果表明该算法相较于GAV模式映射算法提高了数据集成效率,缩短了查询时间.