摘要
针对帧级别预测网络结构中的动作时序检测提案不连续问题,提出基于时空特征金字塔网络的动作时序检测算法。在帧级别动作预测中,采用多个3D卷积反卷积网络,将空间特征维度降至1维,并将时间特征维度还原到相应的提案长度,得到不同时间尺度下的多个预测。采用非极大值抑制的方式融合多个子网络的预测,并用分类器进行帧级别动作分类,进而得到时序提案。在共享数据集THUMOS14上的实验结果表明,该算法有效地提高了动作的时序区域定位精度。
-
单位上海大学; 自动化学院