摘要

深度神经网络是一种强大且高效的机器学习方法,但是目前用于行为识别的机器学习算法都重点关注画面中的内容,而不能有效建模物体间的位置关系。现实生活中物体间的位置关系非常重要,相同的物体,但是不同的位置关系,表达的含义可以完全不同。针对以上问题,提出了一种基于TEA的改进网络结构,能有效建模物体间的位置关系。首先通过多头运动激励模块学习多个不同尺度的空间形态变化,从而有效建模物体间空间位置关系,其次通过信息融合机制将多个尺度的变化信息融合在一起。在SomethingSomething V1数据集上的结果表明本文提出的方法比TEA在具有空间位置关系辨析的类别上准确率提高了最多15%。