摘要
自然场景中的文本信息非常丰富,然而由于场景中复杂的环境背景以及拍摄角度等因素的干扰,会导致文本定位困难。针对上述问题提出一种结合最大极值稳定区域和笔画宽度变化特征的自然场景文本定位方法:首先使用MSER对图像进行文本检测,然后对图像进行边缘化处理,并优化笔画宽度变换特征的提取,使用形态学操作去除噪点、填充间隙优化边缘图像并沿边缘像素点的梯度方向计算笔画宽度值,根据笔画宽度变化特征等获得连通域,最后根据规则过滤非文本域并合并连通域。使用ICDAR 2003文本定位竞赛数据集测试,经计算该方法有较高的正确率和召回率。通过实验结果证实了方法的有效性,可以较为准确地定位出自然场景中文本。
- 单位