摘要
<正>在自监督学习中,神经网络自己就可以弄清楚什么东西重要。这一过程可能正是人类大脑大获成功的原因。近十年来,许多令人印象最深刻的人工智能系统都使用大量带有标记的数据进行学习。例如,一幅图像可能被标记为“虎斑猫”或“山猫”,以便“训练”人工神经网络能够正确区分虎斑猫和山猫。这种策略极其成功,但同时也存在严重的缺陷。这种“监督式”训练需要人工标记数据,极为费力,而神经网络通常会走捷径,学会将这些标记与最少的信息相关联,而这些信息有时只是表象。例如,神经网络可能会根据是否有草来识别奶牛的照片,因为在拍摄时,通常会让奶牛待在田野中。