基于去偏对比学习的多模态命名实体识别

张鑫; 袁景凌<sup>*</sup>; 李琳; 刘佳

摘要

命名实体识别作为信息抽取的关键环节，在自然语言处理领域有着广泛应用。随着互联网上多模态信息的不断涌现，研究发现视觉信息有助于文本实现更加准确的命名实体识别。现有工作通常将图像视为视觉对象的集合，试图将图像中的视觉对象与文本中的实体显式对齐。然而，当二者在数量或语义上不一致时，这些方法往往不能很好地应对模态偏差，从而难以实现图像和文本之间的准确语义对齐。针对此问题，该文提出了一种基于去偏对比学习的多模态命名实体识别方法(DebiasCL),利用视觉对象密度指导视觉语境丰富的图文作为扩充样本，通过去偏对比学习优化图文共享的潜在语义空间学习，实现图像与文本间的隐式对齐。在Twitter-2015和Twitter-2017上进行实验，DebiasCL的F1值分别达到75.04%和86.51%,在“PER.”和“MISC.”类别数据中F1分别提升了5.23%和5.2%。实验结果表明，该方法可以有效缓解模态偏差，从而提升多模态命名实体识别系统性能。

单位
中国科学院武汉文献情报中心; 武汉理工大学

收藏分享被引浏览

更新时间：2024-03-19 00:33

基于去偏对比学习的多模态命名实体识别

摘要

产品服务

站内浏览

服务支持

联系方式

科研之友