一种倒排索引压缩方法

作者:白福均; 高建瓴; 李宛蓉; 贺思云; 肖绍武
来源:计算机应用研究, 2019, 36(01): 106-109.
DOI:10.19734/j.issn.1001-3695.2017.06.0647

摘要

针对自适应分段压缩ASCS算法进行了研究,对于ASCS算法中采用的均匀分段方式并非最优分段问题,提出以人工蜂群算法优化ASCS算法中的分段方式;对于ASCS算法考虑序列占用空间的影响因素过于单一问题,提出多因素下的改进算法;对于分布不均的长序列在ASCS算法下压缩率不理想的问题,提出先排序后差分编码操作再以ASCS算法压缩。通过对比实验证明,优化改进后的算法可以较显著地压缩倒排索引。

全文