摘要

本文针对自然场景下背景复杂、字符残缺、阴影遮挡等多种情形,为了提高文本定位的准确率,提出了一种改进的最大稳定极值区域(Maximally Stable External Region,MSER)的方法。首先将图片进行通道分离,对每个颜色空间分别提取MSER区域,然后将每个通道得到的MSER进行融合,再通过神经网络模型进行背景和文本分离。最后将得到的字符进行文本合并,得到最终的文本行,通过试验,此方法在ICDAR2011、ICDAR2013公开数据集上有较好的试验效果。

  • 单位
    中国传媒大学