摘要

针对文字排版单一、背景干净的图片提取和识别文字,现有的OCR技术已经被广泛应用且技术成熟。而针对复杂的背景图片,已知的方法有最大化似然法,边缘点检测法,角点检测法及深度学习法等检测效果还不太理想。提出了在复杂背景图像中,利用特征点定位自然场景图像文本的新方法,该方法的核心思想是:将特征点检测技术用于提取连通分量中边缘的角点,以选择候选区域,然后通过张量投票验证候选区域。最后通过使用区域面积条件,方向和纵横比过滤掉非文本的区域。这种方法具有快速和通用性的特点,在精确度方面,该方法也可以取得不错的效果。

  • 单位
    武汉邮电科学研究院; 南京烽火星空通信发展有限公司