摘要
现阶段文本检测的研究主要面向自然场景数据集进行,针对繁体中文图像内嵌文本场景难以有效检测的问题,本文提出了一个基于分割方法的繁体中文报纸图像文本检测模型。该模型使用Resnet50和FPN作为特征提取网络,采用分割实例缩放加扩展算法的方法生成用于预测文本框的二值图,并提出了周围填补、循环检测加区域覆盖的方法增强检测效果。该模型针对自建繁体中文报纸数据集的实验结果的三项指标均在0.9左右,且相比于目前文本检测效果较好的DBNet的实验结果均提升了5%~7%,针对繁体中文报纸图像文本检测任务具有一定的优越性。
- 单位