摘要

手势交互是人机交互系统的一个重要组成部分。针对现有SSD(Single Shot MultiBox Detector)网络中不同尺度特征间的独立性,无法充分利用各特征间的关联信息,导致对遮挡和不完整手的检测精度偏低等问题,提出一种改进的SSD算法,通过引进多尺度高分辨率保持特征融合模块,将来自不同层的不同分辨率的特征图进行融合形成新的特征图,其不仅保留了原有特征图的特征信息,还结合了不同层的细节信息和上下文较强的语义信息。利用原有SSD检测方法,生成候选预测框,利用非极大抑制(Non-maximum Suppression)得到最终检测结果。实验结果表明,该方法在EgoHands手势数据集上优于原始SSD方法和其他三种先进方法。