摘要
已有的场景文本检测算法在处理任意形状的文本区域时,会将多余的背景区域也包含在内,为了自动学习聚焦任意形状的文本区域,提出一种注意力监督策略下的文本检测算法.首先使用深度残差网络作为骨架网络提取包含多尺度信息的特征图,然后通过注意力掩膜生成模块将融合特征图转换生成注意力掩膜,再通过背景抑制模块,利用注意力掩膜监督生成下一级特征图,最后经过一系列卷积操作生成分割掩膜,处理优化后得到最终的文本检测结果.实验表明,所提算法在ICDAR2015数据集上的多指标综合表现优越,其中F值相较对比算法提高了2.1%.
- 单位