文本检测领域的非极大值抑制(NMS)算法延迟过大,影响整体实时性,为此提出一种后处理加速方法。采用基于位置范围的候选框分类方法代替提前排序,减少计算复杂度;通过多次缩放优化交并比计算公式,补充完全覆盖的约束条件,减少由缩放导致的小尺寸候选框冗余的问题;将判断条件复用并设计三级流水线的计算单元,进一步减少计算延迟。实验结果表明,加速器在Zynq-XC7Z020上部署的功耗为3.28W,相比CPU实现的NMS和LANMS,性能提高了67倍和38倍。