摘要
快速且高精度的文本识别方法在医疗发票识别与入库中有着重要的应用,但相比于激光打印的文本,针式打印文本存在断点,且识别效率和识别精度不高。提出了一种以深度学习技术为核心的医疗发票针式打印文本识别方法:首先对针式打印发票图像做预处理操作,再结合改进的卷积神经网络(CNN)和循环神经网络(RNN)的优势来识别针式打印字符。分别采用字体文件生成的多张单字符图像和7000多条医学术语作为CNN和RNN网络的数据集训练网络,通过最终得到的网络模型来完成医疗发票的识别,试验结果表明,相比于单一的CNN网络,CNN-RNN方案能够得到更高的识别准确率。
- 单位