摘要
视觉光流计算是计算机视觉从处理2维图像走向加工3维视频的重要技术手段,是描述视觉运动信息的主要方式。光流计算技术已经发展了较长的时间,随着相关技术尤其是深度学习技术在近些年的迅速发展,光流计算的性能得到了极大提升,但仍然有大量的局限性问题没有解决,准确、快速且稳健的光流计算目前仍然是一个有挑战性的研究领域和业内研究热点。光流计算作为一种低层视觉信息处理技术,其技术进展也将有助于相关中高层级视觉任务的实现。该文主要内容是介绍基于计算机视觉的光流计算及其技术发展路线,从经典算法和深度学习算法这两个主流技术路线出发,总结了技术发展过程中产生的重要理论、方法与模型,着重介绍了各类方法与模型的核心思想,说明了各类数据集及相关性能指标,同时简要介绍了光流计算技术的主要应用场景,并对今后的技术方向进行了展望。
-
单位中国科学院自动化研究所; 认知神经科学与学习国家重点实验室; 北京师范大学