摘要

本发明提出了一种人-物交互检测数据集的构建方法,用于解决现有技术中存在的因数据集中的图片之间缺少因果关系导致的人-物动态交互检测精度较低的技术问题。实现步骤为:设置构建人-物交互检测数据集所需的参数;采集每个场景Si的原始视频并进行剪辑;获取原始视频段集合V’的总图像集合P;获取命名总图像集合P’及其总标注文件集合x;获取人-物交互检测数据集。本发明可以应用于训练人-物交互检测神经网络的类似场景。