摘要

随着信息技术的进步,在线数据共享等应用成为研究焦点.现有材料实验数据存储结构为复杂表,难以直接转换为二维表;数据的结构、存储方式多样;难以数据分享.为解决材料领域异构数据间共享,本文提出以基于规则的本体生成方案,实现由复杂表生成本体的过程.从复杂表生成本体速度比从复杂表解析入库快五倍.为实现数据共享,本文提出利用本体实例匹配寻找相似信息.常用匹配工具对材料实验本体的实例匹配结果不佳.本文分析其原因并针对材料领域数据源当前情况,提出基于TF-IDF算法的两种改进匹配方案,改善了在缺乏领域知识和词典下的匹配结果.为整个材料数据生态环境的建设探索出一条实现路线.其与现有常用实例匹配工具相比在材料实验数据的实验结果更适合.

全文