摘要

为高效地存储和管理大规模语义Web数据,结合语义Web数据查询的特点,提出一种基于HBase的资源描述框架RDF(ResourceDescriptionFramework)数据存储改进方法。该方法将以主语+谓语、谓语+宾语、宾语+主语为索引的RDF数据存放在SPO、POS、OSP三张索引表中,同时将POS表按类划分为PSO和POS两类,并给出改进的查询索引方法。对数据的加载存储,利用HBase自带的BulkLoad工具将数据上传至HBase存储表中。通过理论分析和实验结果显示,改进的存储方法对固定谓语的查询能作出快速响应;BulkLoad并行加载数据具有较高的加速比,在缩短数据加载时间的同时能提升系统整体存储性能。