摘要
视频数据是人们日常生活中最重要的信息载体之一.视频萃取(video distillation)通过研究视频数据的时空和语义特性,探索简洁高效的数据展示形式和信息感知模态,是计算机视觉和人工智能的重点研究内容.近年来,随着视频获取方式的快速革新和拍摄需求的多样化发展,视频数据的智能化分析任务面临着新的机遇与挑战,涌现出众多的视频萃取方法.本文创新性地从信息论的角度,解释了数据、信息和知识之间的关系,确立了视频萃取的核心是提高单位数据量的信息提供能力这一基本原则,并依据数据信容(information capacity)分析,从理论上对视频萃取中的各项任务进行了统一.进一步地,分类讨论了视频时空表征中的关键问题与解决方案,系统地分析了从内容、目标和语义角度进行视频萃取的方法,结合视频摘要、浓缩和描述任务,梳理出三条发展主线,展现了视频萃取的发展态势.更重要的是,本文对现有方法的优势与缺陷进行了深入的思考与讨论,指出了尚未解决的若干关键科学问题,并对解决方案进行了初步探讨.同时,本文对视频萃取研究所面临的挑战与未来发展趋势进行了系统的分析与展望.
- 单位