摘要
针对目前文本识别网络中参数多、识别速度较慢的不足,提出了一种改进的端到端文本识别网络结构。该结构采用MobileNet-V3替代VGG模型,即采用深度可分离卷积替换掉标准卷积,同时在网络中嵌入了空间注意力模块,使网络能够更多地关注输入图像中的字符部分。通过多个测试数据集,包括ICDAR2003、ICDAR2013和SVT与典型算法进行了实验对比分析,结果表明,改进的模型可以在不降低准确率的情况下,实现网络参数量下降为原来的1/6,速度提升约50%。
-
单位江苏理工学院