一种改进型卷积神经网络文本识别方法

作者:周兴杰; 罗印升*; 宋伟
来源:江苏理工学院学报, 2020, 26(06): 44-49.
DOI:10.19831/j.cnki.2095-7394.2020.06.008

摘要

针对目前文本识别网络中参数多、识别速度较慢的不足,提出了一种改进的端到端文本识别网络结构。该结构采用MobileNet-V3替代VGG模型,即采用深度可分离卷积替换掉标准卷积,同时在网络中嵌入了空间注意力模块,使网络能够更多地关注输入图像中的字符部分。通过多个测试数据集,包括ICDAR2003、ICDAR2013和SVT与典型算法进行了实验对比分析,结果表明,改进的模型可以在不降低准确率的情况下,实现网络参数量下降为原来的1/6,速度提升约50%。

  • 单位
    江苏理工学院