摘要

场景分类在图像理解和计算机视觉中是一个挑战性问题。有效的图像表示在场景分类任务中至关重要。CNN特征在场景分类任务中表现相对突出,但仍有缺陷,其主要表征图像的全局特征,忽略了局部信息,且缺乏几何不变性。本文通过编码多尺度局部图像块的中层CNN特征,获得图像的局部信息,并将编码特征与原始图像的全局CNN特征进行多通道融合来描述场景图像,获得更高效的图像表示,以实现更好的分类判别。本文在两个常用的场景数据集上进行实验评估,结果表明,该方法在场景分类任务中取得了令人满意的效果。