用于三维物体识别的分组卷积神经网络

作者:祁少华; 杨国为*
来源:青岛大学学报(工程技术版), 2022, 37(03): 10-22.
DOI:10.13306/j.1006-9798.2022.03.002

摘要

为寻找一些适合对视图进行分组的函数以对视图进行更合理的分组,本文主要对用于多视角三维物体识别的分组双池化卷积神经网络进行研究。构建了包括以卷积神经网络(convolutional neural network, CNN)为主的骨干网络、L2范数-ReLU激活函数(L2-ReLU,LR)分组机制和双池化融合模块的DPCNN网络,LR分组机制能够利用L2范数和ReLU激活函数性质,计算视图的区分度得分,增强分组模块的可解释性,更合理的对多视图进行分组,在组内和组间均使用池化加权进行特征融合,并在主流的ModelNet40数据集上进行实验。实验结果表明,与其他最先进和最有代表性的方法相比,在分类任务上,实例精度提升了0.1%~5.87%,分类精度提升了1.57%~7.57%;在检索任务上,平均精度均值提升了3.31%~13.19%,同时证明LR分组机制对检索任务的性能具有明显的提升,说明本文方法能够达到先进的性能。该研究为多视角3D物体识别领域提供了新的方法思路。

全文