摘要
由于场景文本图像中背景的复杂性和文本方向的不确定性,精确定位文本位置难度加大。基于此,根据R2CNN算法对多方向文本的处理思想,提出将该思想与SSD算法相结合,即利用文本区域左上角、右上角坐标以及文本区域的高与SSD算法每一层特征层中不同纵横比的锚点框进行匹配,利用非极大值抑制筛选出最优文本框,获得文本区域。为适应场景文本,提出增添相应的锚点框纵横比,从而进行自然场景文本检测。实验结果表明,所提方法不仅可以检测出倾斜的场景文本,而且提高了SSD算法在场景文本检测时的准确性和召回率,最终准确率为0.705 6,召回率为0.534 2,F值为0.608 0。
- 单位