摘要
作为数据库重要的底层技术,冷热数据识别旨在动态缓存热数据驻留内存、淘汰冷数据至外存,通过提高缓存命中率加快数据库访问响应速度。传统冷热数据识别方法如LRU、LFU主要针对时效性、频率性业务场景,当业务场景改变时,难以自适应新业务场景的冷热数据变化规律,因此缺乏灵活性。为此,提出HF-ARC算法,开展自适应业务场景的冷热数据识别。HF-ARC算法融合不同业务场景下的数据时效性与访问频率,实现了数据库冷热数据识别的自适应业务场景调优。基于Flash-DBSim系统仿真平台,分别采用局部、概率、线性三种访问模式模拟时效性、频率性、综合性业务场景。实验结果表明,HF-ARC算法根据不同业务场景冷热数据变化规律,动态调整冷热识别策略。相比非自适应识别算法,可将缓存命中率提高5%~15%;相比其他适应性算法,可将缓存命中率提高1.3%~2.5%。
- 单位