摘要

目标检测是许多计算机视觉任务的基础和前提,是计算机视觉研究的核心问题。在Transformer之前,目标检测算法大多基于卷积神经网络,随着Transformer在自然语言处理领域的巨大成功,目标检测算法也在Transformer上面做出了尝试,并产生了以DETR为首的许多算法,取得了不错的结果。首先介绍Transformer以及它在计算机视觉中的应用,然后介绍DETR算法及其改进方案,并对DETR算法在目标检测任务未来的发展进行了展望。