摘要

针对文字代数应用题求解过程中特征表示维度高及产生指数级可能方程结果空间中正确结果和错误结果比例悬殊的问题,提出一种基于数字相关特征的文字代数应用题求解模型.在对应用题进行自然语言处理的基础上,研究与数字相关的特征并提出特征表示方法;使用深度神经网络,对数字序列和方程模板的匹配建模,实现自动解题.在Alg514数据集上进行训练和测试,与基于Log linear、SVM(Support Vector Mechine)和DQN(Deep Q Network)的方法相比较,准确率提高了19.9%、9%和42.9%.研究结果表明:所研究的方法在一定程度上解决了特征维度高导致误差增加的问题,较大幅度地提高了文字代数应用题自动求解的准确率.