摘要
近年来,深度学习的研究进展本质上是基于"以大数据驱动小任务"的范式,其依靠的是通过大量数据训练的分类器解决一项单一的任务。本文中,我们提出将范式中数据和任务的关系颠倒。在"以小数据驱动大任务"的新范式下,只有少量数据的单一人工智能系统便可以发展出"常识",并且用"常识"来解决各种任务。通过回顾综合了机器与人类视觉常识模型的最新突破,我们将阐释这个新范式的潜力。我们将功能性(functionality)、物理(physics)、意图(intent)、因果(causality)和效用(utility)(FPICU)认定为拥有类人常识的认知人工智能的5个核心领域。对于视觉理解,FPICU超越了传统的"是什么"和"在何处"的问题框架,而聚焦于"为什么"和"怎么样"。这些问题在像素层面上并不可见,却促进了视觉场景的创建、维护和发展。因此,我们将它们称为视觉的"暗物质"。正如仅仅研究可观察到的物质不足以理解宇宙,我们认为不研究学习FPICU等"暗物质"就无法理解视觉。本文通过展示如何在少量训练数据的条件下观测和应用FPICU来广泛完成一系列挑战性任务,从而证明这个新观点具有开发类人常识的认知智能的能力。这些任务包括工具使用、规划、效用推断和社交学习。总而言之,为了完成未曾见过的任务,下一代人工智能技术必须具备类人常识的"暗物质"。