摘要

文本行检测是满文档案数字化的重要环节,目前相关研究较少,特别是在长文本检测方面。本文借鉴PSENet图像实例分割模型,提出了APSENet的满文档案文本行检测方法。该方法使用Res Net网络提取满文档案文本行特征,通过引入渐进式尺度扩展算法用于后处理网络输出的分割mask,可以有效解决长文本难以检测的问题,通过引入特征通道注意力机制,可以解决由无关背景干扰引起的文本框边距较大问题。实验结果表明,该算法可以取得较好的检测效果。