注意力监督策略下的自然场景文本检测算法

梁浩然; 叶凌晨; 梁荣华<sup>*</sup>; 陈龙; 吴昊

摘要

已有的场景文本检测算法在处理任意形状的文本区域时,会将多余的背景区域也包含在内,为了自动学习聚焦任意形状的文本区域,提出一种注意力监督策略下的文本检测算法.首先使用深度残差网络作为骨架网络提取包含多尺度信息的特征图,然后通过注意力掩膜生成模块将融合特征图转换生成注意力掩膜,再通过背景抑制模块,利用注意力掩膜监督生成下一级特征图,最后经过一系列卷积操作生成分割掩膜,处理优化后得到最终的文本检测结果.实验表明,所提算法在ICDAR2015数据集上的多指标综合表现优越,其中F值相较对比算法提高了2.1%.

单位
杭州海康威视数字技术股份有限公司; 浙江工业大学

收藏分享被引浏览

更新时间：2024-05-23 23:40

注意力监督策略下的自然场景文本检测算法

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友