摘要

在诸多应用如目标跟踪定位服务和工厂生产线中的数据往往是大量且频繁变化的,这些数据需要被实时存储在数据库中并能够快速响应高频率读写,以备在后续环节中被及时处理。学习型索引由于其“低耗高效”的特点而被广泛应用,但现有的学习型索引结构并不能很好地处理频繁变化的动态数据。针对此类频繁更新的动态数据,设计了一种新的高性能学习型索引HPLI,采用一种懒惰式内存释放策略来加速索引的更新;采用子区间独立的键值管理方法用于减少写放大;构建了一个分布转换模型来均衡学习型索引的查询性能与内存占用。对分布转换模型的参数进行压缩,用极少参数的非线性函数作为回归目标模型,可有效降低计算开销对索引性能的影响。实验结果表明,与目前最优的学习型索引结构相比,HPLI可在内存开销更小的情况下具备更好的性能。