摘要

目前票据、单据等文字资料的录入工作仍大量由人工完成,传统的光学字符识别技术进行录入操作存在识别精度低、需要进行后期人为纠错等问题。近年来,基于深度学习的文字识别技术成为热门研究课题,多分类问题的精确度显著提高,文字识别技术得到了快速发展。但由于汉字分类存在种类多、字体多、形近字多等问题,并且网络结构存在模型复杂,过拟合程度大等问题。本文针对这些问题,基于稠密卷积网络,设计了中文文字识别模型。实验结果表明,针对一级汉字识别率可以达到97.1%。在具有较高的文字识别率的同时缓解了梯度消失问题,具有一定的应用价值。