摘要
图像物体识别与检测(图像识别)是计算机视觉领域的一个基础性任务。近年来,深度神经网络等推进了图像物体识别的发展。多尺度问题是图像识别的难点问题之一。引入特征金字塔是解决图像多尺度物体识别的有效途径之一。然而,现有基于特征金字塔的方法大多采用自上而下的语义特征信息融合方式,无法提升大尺度物体识别的精确率。为解决该问题,提出了一种特征金字塔双向语义特征信息融合模型,实现不同尺度图像语义特征信息的双向融合。而后,通过嵌入深度神经网络,形成一种新的基于特征金字塔双向语义信息融合的多尺度图像识别方法,以提升不同尺度物体识别的精确度。实验结果表明:本文所提方法在PASCAL VOC数据集上较其他方法至少提升0.7%的平均精确度均值,在MS COCO数据集上的平均精确度也优于其他方法。实验结果验证了本文所提方法能有效提升多尺度图像识别的精确率。
-
单位昆明医科大学第三附属医院; 昆明医科大学; 基础医学院