摘要
人工智能发展至今正逐渐进入认知时代,计算机对真实物理世界的认知与推理能力亟待提高。有关物体物理属性与运动预测的现有工作多局限于简单的物体和场景,因此尝试拓展常识推理至仿真场景下物体场景流的预测。首先,为了弥补相关领域数据集的短缺,提出了一个基于仿真场景的数据集ModernCity,从常识推理的角度出发还原了现代都市的街边景象,并提供了包括RGB图像、深度图、场景流数据和语义分割图在内的多种标签;此外,设计了一个物体描述子解码模型(ODD),通过物体属性辅助预测场景流。通过消融实验证明,该模型可以在仿真的场景下通过物体的属性准确地预测物体未来的运动趋势,通过与其他SOTA模型的对比实验验证了该模型的性能及ModernCity数据集的可靠性。
- 单位