针对传统基于模板匹配光学识别效果存在不理想的状态,提出改进的深度学习模型的印刷体文档字符识别算法。首先,生成包括一级字库、部分二级字库、英文大小写字母和标点符号的图片数据集,其数量大约为500万张;然后,在Lenet-5网络模型的基础上进行改进和重新构造,提出一种增强型的深度学习模型Lenet-5Pro,该模型可提高印刷体文档的识别率;最后,对比实验结果表明,该模型可以更加有效地提高印刷体字符识别的准确率,其字符识别准确率达到98%以上。