摘要
学习型布隆过滤器的查询速度比布隆过滤器慢一个数量级,这阻碍了学习型布隆过滤器在对实时性要求较高场合中的应用。文中提出了一种基于二值化网络的学习型布隆过滤器优化方法。将学习型布隆过滤器中预过滤器的权重和激活进行二值化,可以加快学习型布隆过滤器的查询速度。使用恶意和良性网址数据集测试了不同假正例率下二值化学习型布隆过滤器和学习型布隆过滤器的总体空间占用和查询时间。为了对查询速度效果改善有直观的认识,在不同平台上分别进行了实验。结果显示,二值化学习型布隆过滤器的查询速度是学习型布隆过滤器的1.5~2倍。
- 单位