一种对查询友好的关联数据压缩方法

作者:顾进广; 彭燊; 黄智生; 符海东; 梅琨
来源:2016-12-23, 中国, ZL201611209081.1.

摘要

本发明涉及一种对查询友好的关联数据压缩方法,该方法包括:定义关系挖掘规则,挖掘三元组中潜在的关联关系;定义压缩查询内存模型,由主语向量、谓语向量和宾语矩阵组成;定义压缩查询内存模型的序列化方式,使用三个辅助符号实现序列化和反序列化;定义在压缩查询内存模型上执行SPARQL的查询方式,主语和谓语查询使用二分查找方法,宾语查询使用线性遍历方法;定义当宾语矩阵过大导致查询缓慢的解决方案,将大的数据块拆分为多个小的数据块。使用本发明方法处理的关联数据集,相对于大部分现有的压缩方案,提高了压缩率,并且在压缩状态下,可以直接进行SPARQL查询操作。