一个聚集查询就是返回一个或多个聚集值的SQL查询。聚集查询处理是联机分析处理(OLAP)的一个基本组成部分,广泛应用于支持决策系统中,以帮助企业进行商业决策。当数据基数很大时,随机抽样方法是最常用的加速聚集查询处理的手段。基于随机抽样的近似聚集查询大致可分为基于在线随机抽样的近似聚集查询和基于离线随机抽样的近似聚集查询两类,并分别适用于不同的应用场景。本文介绍了这2类近似聚集查询处理的研究背景和相关工作以及现有主要的误差估计方法。最后,总结了当前研究遇到的挑战。