摘要

为更好地对动作进行分类,提出基于推理网络的人体动作识别算法。通过Faster RCNN提取以人为主要区域、以场景信息为附加区域的特征信息,将其输入到LSTM中进行边框回归以及动作分类,通过结合Faster RCNN和LSTM获得动作的空间特征和时间特征,得到更精确的动作分类。在公认的两个数据集上进行实验,UCF-101数据集上精确度达到了93.6%,HMDB-51数据集中精确度达到了66.2%。

全文