BC算法性能与图数据格式的关系特性分析

作者:蒋林; 冯茹; 邓军勇; 李远成
来源:西安电子科技大学学报, 2021, 48(06): 57-137.
DOI:10.19665/j.issn1001-2400.2021.06.008

摘要

图计算中数据的压缩格式是图算法访存效率和性能的关键影响因素之一。基于此,针对中心性算法如何根据性能需求选择合适的压缩格式来提升图计算系统性能的问题,采用Skylake Xeon(R) Platinum 8164处理器上的硬件性能计数器对不同数据集的坐标表示、压缩稀疏列、压缩稀疏行、双压缩稀疏列和独立稀疏列压缩的5种压缩格式进行性能评测与分析。性能评价指标包括执行时间、计算量、数据移动量以及功耗等。评价结果表明,当硬件资源受限时,压缩稀疏行压缩格式在处理以遍历为中心的中心性算法时表现最优,可有效地减少程序执行时间、数据移动量以及降低功耗;使用CSC压缩格式,可有效地降低缓存缺失率,更好地利用数据局部性;在考虑内存占用情况下,双压缩稀疏列压缩格式可提高图数据存储效率;独立稀疏列压缩格式在硬件加速器的数据并行性方面有一定的优势,但在通用处理器上的图应用方面并不理想;坐标表示压缩格式在提升图计算应用性能方面相对较差。分析结果对于中心性算法如何根据不同性能需求选择预处理方式提供了依据。

全文