基于点互信息的全局词向量模型

李万理; 唐婧尧; 薛云<sup>*</sup>; 胡晓晖; 张涛

摘要

提出了一种基于点互信息的全局词向量训练模型。该模型为了避免GloVe词向量模型中使用条件概率刻画词语关系时所产生的缺点,使用了另一种相关信息——联合概率与边际概率乘积的比值——来刻画词语间的关系。为了验证模型的有效性,在相同条件下,利用GloVe模型和我们的模型训练词向量,然后使用这2种词向量分别进行了word analogy以及similarity的实验。实验表明,模型的准确率在word analogy的Semantic问题中比GloVe模型表现更好,分别在100维、200维、300维的词向量实验中,准确率提升了10.50%、4.43%、1.02%,而在similarity的实验中,模型准确率提升也达5%～6%。结果表明,模型可以更有效地捕捉词语的语义。

单位
广东中建普联科技股份有限公司; 华南师范大学

收藏分享被引浏览

更新时间：2024-04-10 07:10

基于点互信息的全局词向量模型

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友