摘要

精准分割民国档案图像中的印章,有助于该类档案的智慧利用。针对该类档案存在印侵严重和过多噪声的问题,提出UNet-S(U-Net for Seal)解决方案。在保留U-Net的编解码器结构和跳跃连接基础之上,UNet-S从三个方面进行改进:一是使用多尺度残差模块替代U-Net原有的卷积层,使得UNet-S既能有效提取多尺度特征,又能避免网络退化和梯度爆炸等问题;二是在多尺度残差模块中将普通卷积替换为深度可分离卷积,大幅减少网络的参数量;三是使用BCEDiceLoss(Binary Cross Entropy Dice Loss),并根据仿真实验结果优选权重因子,以解决民国档案数据不平衡问题。与原始U-Net相比,改进后的网络Dice相似系数(Dice)、平均交并比(MIoU)指标、平均像素准确率(MPA)指标分别提高了6.8%、12.9%和0.1%,参数量下降76.64%;与UNet++、DFANet、DDRNet等主流网络相比,Dice指标提升明显。实验结果表明,UNet-S在民国档案数据集中分割效果更佳。