摘要
自然场景下采集的卡证、文档中存在的可见水印,是影响人们阅读效率、机器识别准确度的障碍。为此,提出了一种结合基于特征点匹配的水印检测和基于条件生成对抗网络CGAN的水印去除方案。水印检测部分,通过SIFT特征点检测、FLANN特征点匹配和PROSAC误匹配消隐,估计出几何变换的最佳透视模型实现目标水印定位。水印去除部分采用了pix2pix(image-to-image translation with conditional generative adversarial networks)的模型架构,它借鉴了CGAN的核心思想,混合了L1距离损失和CGAN损失函数,减少了输出图像的模糊度且保留了更多的正确特征。最终能满足自然业务场景下快速且精准的水印去除需求,具有较好的水印检测鲁棒性和去水印效果。此外,还给出了详细的CGAN模型所需的成对训练集扩充方式,构建了大量有效的训练集,提升了去水印模型训练的拟合优度。
- 单位