摘要
目前大多数胶囊网络方法是通过改进迭代路由的方式提高精度,忽略了迭代路由本身复杂的计算量带来的负担,虽然有方法采用无迭代的路由训练胶囊网络,但是精度不佳。针对以上问题,提出了无迭代路由图胶囊网络的场景分类模型。首先,利用简单卷积层提取输入图像的初始特征。接着,提出通道和胶囊间双融合的全局注意力模块,通过依次进行通道和胶囊之间注意力,生成全局权重系数加权高级胶囊特征,使加权后的高级胶囊特征更具判别性,突出重要的胶囊,从而提高分类性能。同时引入能够计算图像间相似性的等变规则化项,建模胶囊网络的显式等变性,潜在提升网络性能。最后,基于边界损失和等变损失的组合损失函数训练整个网络,得到富于判别的分类模型。在多个基准场景数据集上的实验,验证了所提方法的有效性和效率。所提方法在加拿大高级研究所的10类图像数据集(CIFAR-10)上的分类准确率达到90.38%,与动态路由胶囊网络方法相比,提高了15.74个百分点;并且在仿射手写数字数据集(AffMnist)和航空影像数据集(AID)上,分别取得了98.21%和86.96%的平均精度。实验结果表明,所提方法有效提高了场景分类性能。
-
单位智能信息处理与实时工业系统湖北省重点实验室; 武汉科技大学