摘要

针对基于深度学习的手部检测方法网络模型结构复杂,检测速度慢,内存消耗严重,难以满足移动端进行实时人机交互的需求,提出一种轻量化网络模型实现对手部的实时检测。该模型以SSD为基础结构,首先将轻量化网络MobileNet v2作为模型主干特征提取网络,减小模型的参数量和计算复杂度;然后,针对特征提取不充分问题,提出多尺度卷积和特征融合模块,并应用在其中三个预测特征层,通过连接不同尺寸的卷积核,增加网络对不同尺度特征的适应性;最后改进候选框获取方式,采用K-means++聚类算法自适应生成适合手部的候选框,对手部进行准确定位来提高模型的检测精度。为验证所提方法的有效性,在Ego Hands,Oxford Hand两个公开数据集上进行相关实验。实验结果显示,该方法在两个数据集上的准确率分别达96.56%和73.56%,检测速度达45.4FPS和41.2FPS,且模型所占内存仅为19.5M。最后将算法部署在移动端进行测试,结果表明该方法能够为手部检测提供一个轻量化的方法。