摘要

深度学习算法在城市生活垃圾图像检测领域具有重大研究意义。垃圾种类繁多、形态变化大,密集度高且背景复杂。提出一种在YOLOv5中融合卷积注意力模块和Transformer编码器的垃圾图像检测方法。首先,通过数据增强算法和自适应填充算法对数据集进行预处理,并根据数据集自动计算最优先验框尺寸。其次,整合卷积注意力模块提取精细垃圾图像特征,通过通道和空间两个维度强化有效特征。然后,添加Transformer编码器进一步覆盖图像全局上下文特征信息。最后使用先验框在特征图上预测垃圾对象,并将原始的损失函数替换为CIoU,提高定位能力。通过实验证明,该方法可以有效地检测复杂场景下的城市生活垃圾,具备一定的鲁棒性和泛化性能。

  • 单位
    漳州职业技术学院

全文