论视觉理解(英文)

作者:潘云鹤
来源:Frontiers of Information Technology & Electronic Engineering, 2022, 23(09): 1287-1291.

摘要

<正>1视觉识别面对的问题和发展方向人工智能(artificial intelligence, AI)从一开始就将模式识别作为其重要工作领域之一。近年来,深度神经网络(deep neural network, DNN)的成熟使得视觉识别的准确率大为提高,并在医学图像识别、车辆识别、人脸识别等方面广泛投入应用,推动AI产业发展进入高潮。但是,基于DNN技术的视觉识别存在重要缺陷,例如,需要标识的样本数据量较大、模型的鲁棒性较差、学习与推理的结果难以解释、模型泛化与跨数据域迁移能力较弱等。这些问题已成为当前AI研究和应用发展的一大挑战,甚至是障碍。