适用于海量数据应用的多维Hash表结构

吴泉源; 彭灿; 郑毅; 卜俊丽

doi:10.16511/j.cnki.qhdxxb.2017.26.023

摘要

传统的Hash表通过对目标数据进行Hash计算,可以实现数据的快速存取与检索。为了保持较好的存储性能,需要使整个Hash表保持疏松的状态,从而牺牲掉10%25%的空间。这对于海量数据存储而言,是一种巨大的空间浪费。该文提出一种多维Hash表结构,通过增加Hash表在逻辑上的维度,大大降低了Hash表的冲突率,实现了在较高的填充率下获得较满意的性能。实验结果表明:在千万的数据量级上,二维Hash表的冲突率比传统Hash表的减小24个数量级,总体性能则提升了1个数量级。该文还在原有填充率的基础上,提出失效率的概念,进一步完善和统一了Hash表性能评价指标。

单位
国防科技大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-05-11 11:39

适用于海量数据应用的多维Hash表结构

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友