摘要

鉴于Inception-v3网络参数量过大的问题,本文提出了一种有效的手势图像识别方法,能够满足在模型参数量较少的情况下高精度手势识别的需求.本文利用Inception-v3的结构,对原Inception-v3的Inception模块重新进行设计,降低学习的参数量和难度,结合残差连接,保护信息的完整性,防止网络退化,引入注意力机制模块,让模型聚焦于有用的信息而淡化无用信息,在一定程度上也防止了模型的过拟合,并且在模型中进行上采样与低层特征进行特征融合,融合后的特征比原输入特征更具有判别能力,进一步提高模型的准确率.实验结果表明改进的Inception-v3网络的参数量仅为1.65 M,而且拥有更高的准确率和更快的收敛速度.将ASL手语数据集与孟加拉手语数据集分别打乱,然后按照4:1的比例单独划分出训练集和验证集.改进的Inception-v3在ASL手语数据集与孟加拉手语数据集上的识别率分别达到了100%和95.33%.

全文