摘要
依据图像级标签位置推断方式的不同,将基于图像级标签的弱监督图像语义分割划分为基于超像素的方法和基于分类网络先验的方法,并分别从各类方法的原理、优缺点、关键环节、主要技术、特征、超像素/候选区域分割方式、种子区域产生方式、网络结构和数据集等方面进行了详细的分析和总结。其次,对基于图像级标签的弱监督图像语义分割常用的数据集和评价指标进行了总结,并对各数据集的特点进行了详细的描述。最后,在MSRC、PASCAL VOC 2012、MS COCO和Sift Flow数据集上对基于图像级标签的弱监督图像语义分割方法的性能进行了对比与分析,并分别从面向大规模多媒体分享网站大数据、特定应用场景、图像级标签位置推断策略三个研究方向对弱监督图像语义分割的研究方向进行了展望和预测。
- 单位