摘要
手写数学表达式的识别是一项困难的工作,文章聚焦于离线手写表达式识别方法的研究,提出由残差网络(ResNet)以及Transformer网络组成的模型结构。编码解码模型通常端到端训练,输入为图片,输出为识别结果。文章提出的网络使用残差网络进行特征的提取并进行位置编码,用以生成待计算序列,并使用Transformer网络进行序列的编码和解码分析。通过手写数学表达式识别的竞赛组织(CROHME)提供的数学公式数据来验证所提出的算法,结果表明,本方法具有可行性。
-
单位南京邮电大学; 自动化学院