针对现有的最大容错块挖掘算法受容错度影响较大,在大型事务数据库和稀疏数据库性能不佳的情况,提出了基于并行PSO的最大容错块挖掘算法。通过删除小于最小支持度的项提高数据库的密度,利用高斯扰动优化的PSO算法结合Spark框架对目标数据库进行最大容错块挖掘。实验结果表明,多组不同规模数据集实验结果均优于利用整数线性规划设计的最大容错块挖掘算法,对于同一数据库算法效率不会受容错度的影响。