摘要
随着计算机软硬件的迅速发展,人工智能(AI)模型在感知型任务中实现了接近或者超越人类能力的性能水平。然而,为了开发能够全面理解世界的成熟AI系统,模型必须能够生成视觉概念,而非仅仅是识别它们。首先全面概述现有的生成框架,其中包括对抗生成网络、变分自动编码器、流模型和扩散模型;然后,回顾最近在图像和视频生成方面的最新进展,并讨论它们的局限性;最后,提出改进现有视觉生成模型的可行策略,并概述有前途的未来研究方向。这些讨论和探究对推动视觉生成建模领域的发展和全面挖掘AI系统在视觉概念生成领域的潜能具有重要的意义。
- 单位