摘要
针对跨语言文本匹配问题,提出一种基于GAN+AT-CNN的文本匹配算法。具体则通过监督式GAN文本特征映射模型和AT-CNN文本匹配模型相结合,增加样本丰富性,简化跨语言特征映射过程,从而提高映射速度和文本匹配准确度。分别将监督式GAN特征映射模型与传统的全连接神经网络(NN)、经典机器翻译模型ConvSeq2Seq, AT-CNN文本匹配模型与Bi-LSTM、ABCNN模型进行比较。结果表明,在特征映射模型的实验中,监督式GAN特征映射模型精确度平均值较其他模型高0.12%-8.46%,较无监督式GAN映射模型精确度高30.89%;训练时间则较NN长0.2 h,较ConvSeq2Seq模型短2.2 h。而在跨语言文本匹配实验中,AT-CNN文本匹配模型精确度平均值则较其他模型高1.78-7.1,但训练时间也较其他模型高127 s~1 176 s。实验证明,无论是在训练时间还是精确度上,本文使用的模型综合上都优于其他对比模型,值得应用于未来的跨语言文本匹配工作中。
- 单位