基于融合池化和注意力增强的细粒度视觉分类网络

肖斌; 郭经伟; 张兴鹏<sup>*</sup>; 汪敏

doi:10.16451/j.cnki.issn1003-6059.202307007

摘要

细粒度视觉分类核心是提取图像判别式特征.目前大多数方法引入注意力机制，使网络聚焦于目标物体的重要区域.然而，这种方法只定位到目标物体的显著特征，无法囊括全部判别式特征，容易混淆具有相似特征的不同类别.因此，文中提出基于融合池化和注意力增强的细粒度视觉分类网络，旨在获得全面判别式特征.在网络末端，设计融合池化模块，包括全局平均池化、全局top-k池化和两者融合的三分支结构，获得多尺度判别式特征.此外，提出注意力增强模块，在注意力图的引导下通过注意力网格混合模块和注意力裁剪模块，获得2幅更具判别性的图像参与网络训练.在细粒度图像数据集CUB-200-2011、Stanford Cars、FGVC-Aircraft上的实验表明文中网络准确率较高，具有较强的竞争力.

单位
西南石油大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-03-19 04:37

基于融合池化和注意力增强的细粒度视觉分类网络

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友