摘要

场景识别是计算机视觉领域重要的研究方向。采用传统神经网络的场景识别方法对数据需求量较大、训练时间较长且不能捕捉图像的空间关系,对复杂的场景图像识别有一定的局限性。针对这一问题,在CapsNet(胶囊网络)的基础上,提出SceneCaps模型,并在Scene15和Places2数据集上进行实验。实验表明,与CapsNet模型相比,SceneCaps模型在Scene15和Places2数据集上的识别精度分别平均提高了0.25%和0.03%,训练速度分别平均提高了29%和69%,验证了该模型的有效性。