摘要

针对现有键值数据库存储系统缺乏热点意识,导致系统在高度倾斜的工作负载下性能较差且不可靠,论文提出了一种自适应热点感知哈希索引模型,该模型基于Key值摘要信息实现了一个高性能哈希表。首先,利用Key的摘要信息代替Key值,压缩Key的存储空间,优化哈希表中桶的数据结构;其次,利用CPU的数据级并行技术以及CPU Cache Line,对哈希表的探查操作进行优化;最后,为解决摘要信息导致Key值无法精准比较,需要额外磁盘I/O的问题,设计了一种自适应Key值调度算法,该算法根据当前可用内存大小、哈希索引负载以及访问热点情况动态地调整Key值的存储位置。在YCSB仿真数据集上进行了实验,实验表明,相较于最先进的哈希表,自适应热点感知哈希索引在相同内存使用率的情况下,将速度提升至1.2倍。

全文