摘要

跨语言的词汇意义比较不仅是词汇类型学研究的重要基础,也可为二语词汇习得和文化影响研究提供参考。为了实现大规模的词汇意义比较,本文提出了一种基于跨语言词向量对齐的方法,以汉语和日语的词汇语义比较为例展开了系统分析。首先,通过汉语和日语预训练词向量获得两种语言中的词汇语义表示,然后,对预训练的两种语言词向量进行空间对齐,以此为基础,分别从词汇概念语义场和同形汉字词两个角度探究汉语和日语词汇的语义相似程度。考察汉日词汇概念语义场时,本文构建了涵盖20个语义场、897个词对的概念词表,通过跨语言词向量计算揭示了两种语言的语义场异同。在同形汉字词分析中,本文通过分类和聚类方法系统考察了3380对同形汉字词的意义分布情况,以期为跨语言词汇意义比较研究提供新的视角。

全文