摘要

当前带监督的词义消歧模型利用不同词义的注释信息和预训练的语言模型已经得到了较高的消歧结果。但是带监督的词义消歧模型的语义数据需要人工手动标注,使得带监督的词义消歧模型的扩展性较差。提出了一种结合知识图谱和文本层次结构的双编码器词义消歧方法,通过引入知识图谱中的结构化知识以补充更多的扩展语义信息,采用上下文输入文本的层次结构描述单词和短语的含义,并构筑基于BERT的双编码器,引入图注意力机制来降低上下文输入文本中的噪声信息,从而提高短语形式目标词的消歧准确率,最终提高方法的消歧效果。通过在5个测试数据集中与最新的9个对比算法的对比,该方法的消歧准确率大都优于对比算法,取得了较好的效果。