摘要
本体对齐任务旨在挖掘不同本体中具有相同语义的概念,但不同本体间名称和结构等信息的异质性给该任务带来了挑战。为解决以上的问题,提出一种基于词向量和概念上下文信息的本体对齐方法。该方法首先借鉴自监督学习的思想,通过抽取部分概念对应的短语构建文本数据集,并使用构建好的数据集基于词向量训练短语相似度计算模型。之后,提出一种概念相似度计算模型,该模型利用训练好的短语相似度计算模型获得名称短语之间的相似度并考虑了各概念的上下文信息。最后将用于匹配的本体转化为二部图,并在该图上建立权值匹配模型进行优化求解。通过在多个数据集上进行测试,该方法与基准模型相比取得了比较好的效果,证明了该方法的有效性。
-
单位信息工程大学