摘要

基于深度学习的方法明显提升了目标检测的精度,但在面对行人、汽车等自然场景下的密集目标时,存在包围框预测不准、容易重叠等问题。综述了深度学习密集目标检测相关方法和技术。从神经网络架构的角度对密集目标检测的方法进行分类,对基于卷积神经网络模型和基于Transformer深度神经网络模型进行了比较分析。对于卷积神经网络,从有锚和无锚的角度进行综述;对基于Transformer架构的网络模型,从单一Transformer和增加CNN结构的Transformer模型进行对比综述。最后结合目前的研究成果对密集目标检测领域亟待解决的问题和未来的发展方向进行展望和总结。