摘要

针对自然场景的文本检测,构建了一种基于卷积神经网络(CNN)和长短时记忆网络(LSTM)的自然场景文本识别框架,运用CNN网络对图像中的静态特征进行提取,LSTM提取上下文特征信息。在解码上,提出了一种混合的CTC-Attention机制对输出层的编码进行解码。

  • 单位
    江苏联合职业技术学院