摘要
体育视频自动分类是一项广播公司内容存档以及视频场景理解的基本任务,而时序建模是体育视频分类的关键。为了解决这个问题,本文提出了一种新的体育视频分类方法,称为时间差分网络(Temporal Difference Networks, TDN),重点是捕获多尺度时间信息以进行有效的体育动作分类。TDN的核心思想是通过明确利用时间差异算子来设计一个有效的时间模块,并系统地评估其对短期和长期运动建模的影响。为了完全捕获整个视频的时间信息,TDN建立了一个两级差分模型:对于局部运动建模,连续帧上的时间差异用于为2D CNN提供更精细的运动模式,而对于全局运动建模,跨段的时间差异被结合以捕获用于运动特征激发的远程结构。对两个公共视频异常检测数据集,即UCF体育运动数据集和SVW野外体育运动数据集的实验结果证明了所提出的方法性能优于现有方法。
- 单位