摘要

随着军队信息化建设的逐步深入,当前存在大量的文稿、单据、表格迫切需求高精度的文字识别处理。一般光学字符识别(OCR)技术如谷歌开源Tesseract引擎等对环境光源、字体,视角要求苛刻,仅能兼容扫描文档,难以实现自然环境下拍照使用需求,使用困难且准确率低。该文提出一种基于可微二值化网络(Differentiable Binarization Net, DBNET)进行场景文本分割,并采用CRNN-CTC进行文字识别的复合二阶段识别方法,可在复杂光源、多角度视角的自然场景中实现长序列多文字识别。该方法的识别效率及准确率远远高于传统OCR方法、对比其他深度学习方法亦存在较大优势。在该方法基础上进一步构建基于异步消息队列的并行架构服务器系统,使得技术得以进一步实用化。

  • 单位
    中国人民解放军装甲兵工程学院