基于分割方法的繁体中文报纸文本检测

作者:姜宇; 潘家铮; 陈何淮; 符凌智; 齐红*
来源:吉林大学学报(工学版), 2023, 53(04): 1146-1154.
DOI:10.13229/j.cnki.jdxbgxb.20210829

摘要

现阶段文本检测的研究主要面向自然场景数据集进行,针对繁体中文图像内嵌文本场景难以有效检测的问题,本文提出了一个基于分割方法的繁体中文报纸图像文本检测模型。该模型使用Resnet50和FPN作为特征提取网络,采用分割实例缩放加扩展算法的方法生成用于预测文本框的二值图,并提出了周围填补、循环检测加区域覆盖的方法增强检测效果。该模型针对自建繁体中文报纸数据集的实验结果的三项指标均在0.9左右,且相比于目前文本检测效果较好的DBNet的实验结果均提升了5%~7%,针对繁体中文报纸图像文本检测任务具有一定的优越性。