摘要

随着互联网与信息化的普及,数据资源越来越丰富,数据的多源性使得大量异构数据产生。语义匹配旨在评估待匹配数据含义之间的相似程度,以便算法可以从数字角度无缝地管理各种信息,是解决数据异构问题的关键技术,在信息检索、自动问答和搜索引擎等应用中占有重要的地位。考虑到目前的语义匹配方法众多,从传统方法和基于深度学习的方法两方面对语义匹配方法进行系统梳理,将传统的语义匹配方法分为4类:基于字符串、基于体系结构、基于特征属性和混合方法,将基于深度学习的语义匹配方法分为3类:基于粗粒度向量、基于细粒度向量和直接建模匹配模式,并对各种方法进行分析总结,有助于全面把握和深入了解语义匹配模型的研究现状。

全文