基于Transformer的图像抠图模型研究

作者:曾碧凝; 王国栋*
来源:青岛大学学报(工程技术版), 2023, 38(03): 9-15.
DOI:10.13306/j.1006-9798.2023.03.002

摘要

针对图像抠图模型存在的体积大以及生成结果精度低的问题,本文基于Transformer对图像抠图模型进行研究。以简单的非参数运算及高效的傅里叶变换为特征混合器,消除Transformer的体积弊端。此外,为处理因维度变换而频繁使用的重塑操作对速度的减缓,将编码器设计为由高效抠图(efficient matting, EM)块和补丁嵌入块堆叠而成的局部尺寸一致结构。同时,为证明本方法的高效性,将本方法与最先进的模型在Composition-1k数据集上,进行对比分析。分析结果表明,与提出Composition-1k数据集的Deep Image Matting模型相比,本模型的均方误差(mean square error, MSE)降低了9.0×10-3,绝对误差和(sum of absolute difference, SAD)降低了23.1。与基线模型MG Matting模型相比,本模型的参数量和浮点运算次数(floating-point operations per second, FLOPs)成倍下降,证明本方法性能较高,有效解决了图像抠图问题。该研究具有广阔的应用前景。

全文