摘要

本发明公开了一种基于扰动对抗训练的跨语言词向量构建方法,其步骤包括:首先构建源语言和目标语言的词向量并对其进行归一化;然后分别构建双判断器对抗网络和扰动重构网络;再利用归一化后的源语言和目标语言词向量对双判断器对抗网络和扰动重构网络进行分步协同训练;最后从训练完成的双判断器对抗网络中提取跨语言映射矩阵,为源语言和目标语言构建跨语言词向量。本发明能通过训练扰动的源语言词向量来有效地提高低频词的跨语言词向量的质量,从而能获取质量更高的跨语言词向量。