摘要

人工方式核验日益增长的网店工商扫描件信息,存在着工作量巨大,因疏忽导致信息录入错误,工作效率和准确性低下等问题。针对以上问题,提出了设计实现基于OCR技术的文字系统。系统主要基于Java语言、Open CV库以及POI工具包进行实现,通过对工商信息扫描图像进行水印去除、灰度化及二值化等预处理,利用水平、垂直投影进行字符切分,采用Open CV相关库函数进行字符识别,最后使用POI工具将识别后的数据写入Excel文件。结果表明,网店工商信息识别提取系统的识别速度快、识别率高。识别系统是很有现实意义的。

  • 单位
    山东华宇工学院