摘要
针对体育训练视频中动作具有低类间变异性的问题,提出了一种新的双流三维时空卷积神经网络(T3DCNN).首先,以乒乓球训练为具体研究用例,构建了包含21个动作类别的训练运动视频数据集(记为PPTVD).然后,提出了T3DCNN模型,该模型的输入为RGB图像序列及其计算的光流,包含了双流时空卷积层.最后,通过实验评估验证提出的模型的有效性.结果显示,T3DCNN达到了90%的准确度,远超过了基线模型.
-
单位泉州信息工程学院