摘要

为了满足医疗行业大量针式票据录入工作的需求,解决传统人工录入方式效率低、精度低的问题,构建了双网络模型下的针式打印字体医疗票据识别方法。传统目标检测网络的参数同时描述了目标的位置与类别信息,其用于大规模定位识别任务时由于参数量庞大导致网络极难以训练,为解决以上问题,提出了双网络模型方法以联合Faster RCNN与深度卷积神经网络实现票据中字符的定位与识别,双网络将定位与识别分步进行以降低任务的复杂度。实验采用自建票据数据集与字库数据集进行网络训练,利用现场采集的票据验证了算法的有效性,通过测试不同参数下模型的性能来选定最佳参数,并对比分析了该方法与传统方法的识别效果。实际测试表明,识别准确率达95.4%,召回率达92.7%,速度达0.76 s/张。

  • 单位
    长江大学; 油气资源与勘探技术教育部重点实验室