从感知到创造：图像视频生成式方法前沿探讨

林倞; 杨斌斌<sup>*</sup>

摘要

随着计算机软硬件的迅速发展，人工智能（AI）模型在感知型任务中实现了接近或者超越人类能力的性能水平。然而，为了开发能够全面理解世界的成熟AI系统，模型必须能够生成视觉概念，而非仅仅是识别它们。首先全面概述现有的生成框架，其中包括对抗生成网络、变分自动编码器、流模型和扩散模型；然后，回顾最近在图像和视频生成方面的最新进展，并讨论它们的局限性；最后，提出改进现有视觉生成模型的可行策略，并概述有前途的未来研究方向。这些讨论和探究对推动视觉生成建模领域的发展和全面挖掘AI系统在视觉概念生成领域的潜能具有重要的意义。

单位
中山大学

收藏分享被引浏览

更新时间：2024-03-18 21:39

从感知到创造：图像视频生成式方法前沿探讨

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友