摘要

本发明公开了基于深度卷积神经网络的第一视角动态手势检测方法,包括步骤:采集不同环境下的具有复杂背景的数字手势图片,人工标记出手势在所述数字手势图片中的外接矩形;设计一个深度卷积神经网络,利用卷积计算进行特征提取,在特征图上预测和滑窗操作得到不同尺寸的候选框,将候选框和真实值进行损失计算并误差反传;利用已标记外接矩形的手指手势图片训练所述深度卷积神经网络,使得深度卷积神经网络收敛且参数稳定;输入第一视角的动态手势视频,将视频拆分成一帧帧图片,检测出图片中手势外接矩形位置的坐标点。与现有技术相比,本发明能准确地检测复杂背景、不同光线下的视频中动态手势。