基于改进SSD算法的自然场景文本检测

作者:孙悦; 艾斯卡尔·艾木都拉*; 阿不都萨拉木·达吾提
来源:电视技术, 2019, 43(08): 1-27.
DOI:10.16280/j.videoe.2019.08.001

摘要

由于场景文本图像中背景的复杂性和文本方向的不确定性,精确定位文本位置难度加大。基于此,根据R2CNN算法对多方向文本的处理思想,提出将该思想与SSD算法相结合,即利用文本区域左上角、右上角坐标以及文本区域的高与SSD算法每一层特征层中不同纵横比的锚点框进行匹配,利用非极大值抑制筛选出最优文本框,获得文本区域。为适应场景文本,提出增添相应的锚点框纵横比,从而进行自然场景文本检测。实验结果表明,所提方法不仅可以检测出倾斜的场景文本,而且提高了SSD算法在场景文本检测时的准确性和召回率,最终准确率为0.705 6,召回率为0.534 2,F值为0.608 0。

全文