摘要

近年来,得益于人工智能技术(Artificial Intelligence, AI)的快速发展,关于自动求解数学应用题(Math Word Problem, MWP)的研究越来越趋向成熟。在自动求解数学应用题任务中,对问题文本进行建模至关重要。针对这一问题,文章提出了一个基于循环神经网络(Recursive Neural Network, RNN)和Transformer编码网络的双路文本编码器(Dual Channel Text Encoder, DCTE):首先,使用循环神经网络对文本进行初步的编码;然后,利用基于自注意力(Self-attention)机制的Transformer编码网络来获得词语的远距离上下文语义信息,以增强词语和文本的语义表征。结合DCTE和GTS(Goal-Driven Tree-structured MWP Solver)解码器,得到了数学应用题求解器(DCTE-GTS模型),并在Math23k数据集上,将该模型与Graph2Tree、HMS等模型进行了对比实验;同时,为探讨编码器配置方法对模型效果的影响,进行了消融实验。对比实验结果表明:DCTE-GTS模型均优于各基准模型,答案正确率达到77.6%。消融实验结果表明双路编码器的配置方法是最优的。