摘要

本发明提供一种利用同源词的日中机器翻译方法、系统、存储介质和电子设备,涉及机器翻译技术领域。本发明将存在汉语同源词的日语词语转化为对应的同源词字形,获取所述同源词字形在共享词典下的词向量表示,记作公有表示,以及获取所当前词语在日语词典下的词向量表示,记作私有表示,合并所述公有表示和私有表示作为当前词语最终的词向量表示。通过利用同源汉字得到中日同源词,扩大了双语间共享的词语数量,且在神经机器翻译中利用共享词嵌入方法,得到更一致的双语语义对齐,从理论上有利于最终翻译效果的提升;此外,存在汉语同源词的日语词语采用公有-私有表示的方法,可以建模日语中同源词语义上偏离其原先语义的语言现象。