摘要

在各个油田企业进行信息化的同时,也产生了大量的信息孤岛,这些信息孤岛为企业的数据共享带来了麻烦,使得企业的工作效率降低。并且随着企业数据模型的不断升级,也给数据集成带来了困难。论文设计了一种通过关键字来表达数据元语义,通过数据元标准来规范数据项和表达数据项的语义,引入编辑距离算法来度量数据项与数据元之间的相似性。再引入杰卡德算法的思想,结合编辑距离算法,利用关键字计算数据元之间的相似度,从而间接得出数据项之间的映射关系,进而得出数据表的映射关系。最终为表达异构模型的映射引出一个映射文件。将中国石油企业的数据元为试验数据,对中石油数据模型中的数据项进行了标准化,以保证研究的实用性。