摘要
为了提高离线手写公式的识别率,提出一种线性变换与多尺度位置编码方法,并设计一个密集网络-位置编码-BiGRU的公式识别模型验证该方法的有效性。该方法利用三角函数的线性变换性质,提取符号的绝对位置和符号之间的相对位置,分别从水平、垂直方向进行多尺度伸缩,提取更细微的符号,以及符号之间的位置关系。基于密集网络-位置编码-BiGRU的公式识别模型的实验结果显示,该模型在2个常见测试集CROHME 2014和CROHME 2016上的识别率分别是49.92%、50.08%,均超过了DenseWAP、DenseWAP-TD等同类研究模型;该位置编码方法比普通坐标系位置提升明显,结构识别率超过68.9%,表明该位置编码方法是有效、可行的。
- 单位