摘要

现有知识图谱实体预测方法一方面只利用邻域和图结构信息增强节点信息,忽略了知识图谱之外的多模态信息对于知识图谱信息的增强;另一方面正负样本对比训练模型时负样本随机排序导致训练效果不佳,且没有额外的信息帮助负样本的训练过程。为此,本文提出了一种多模态课程学习知识图谱实体预测模型MMCL。首先把多模态信息引入知识图谱实现信息增强,利用生成对抗网络优化多模态信息融合过程,生成器生成的样本增强知识图谱信息,同时也提升鉴别器判别三元组真伪的能力;其次利用课程学习算法根据负样本的难易程度对负样本从易到难排序,通过步调函数分层次的把排序的负样本加入到训练过程中,更有利于发挥负样本在鉴别三元组真伪的效果,同时无标签学习避免了训练后期假阴性问题;多模态信息融合互相优化的鉴别器与课程学习训练模型共享参数,帮助提升负样本的训练效果。在FB15k-237和WN18RR两个数据集上进行实验,结果表明,MMCL与基线模型相比,在平均倒数排名(Mean Reciprocal Rank, MRR),Hits@1,Hits@3以及Hits@10四个性能评价指标均有明显提升,验证了所提模型的有效性和可行性。