摘要

本文提出了一个针对电商平台低质量图片进行文字分割的算法。汉字的主流识别方法主要为特征识别,结合置信度的词语句子识别和字库匹配识别。本文采用卷积神经网络进行识别单字,使用tesseract识别句子,结合两者修正字符,同时利用识别出的字符,对文字分割进行辅助分割,从而达到了极高的文字定位率。

  • 单位
    重庆邮电大学移通学院