摘要
DEFLATE压缩算法作为计算机领域中使用最广泛的开源压缩算法,大量网络协议和应用程序使用该算法对数据进行压缩处理。在当前大数据时代,无论对数据压缩算法进行适应性改进,还是为网络流量识别中的压缩流量识别提供依据,都需要对数据压缩算法特征进行分析研究。采用数据分析方法,根据DEFLATE算法流程特点,对算法进行模块分割,设计卡方、信息熵、加权累积和、字节游程均值4项分析指标,对DEFLATE算法特征进行分析研究,发现其包含的LZ77模块压缩性能和整个算法联系紧密,不同类型数据经过DEFLATE算法压缩后,分析指标在趋向一致的同时又表现出一定的区分性,表明DEFLATE算法在压缩效率方面较为依赖LZ77压缩模块,相比压缩前数据,压缩数据更加趋近于随机数据,另外不同类型文件对应的压缩数据,其统计特征也表现出一定的差异性。
-
单位信息工程大学