摘要
多查询优化问题是从一组查询中找出公共子结构,将其结果缓存起来,每个查询可以利用缓存结果构建自己的结果。由于知识图谱上的多查询优化是NP-hard问题,现有方法无法在大量查询同时到达时高效地查找公共子结构,也无法保证优化后查询时间一定减少。因此,本文提出了一个新的分布式,基于内存的RDF查询引擎Leon来处理多查询优化问题。Leon使用了基于特征集合的索引和划分方法,具有简单高效、空间占用小的特点。针对现有检测查询之间公共子结构检测算法时间复杂度高的特点,本文提出了一个新颖的多查询优化算法:利用特征集合快速过滤没必要优化的查询,在剩下来的查询中精确、高效地查找公共子结构。实验结果证明:引入多查询优化情形下,时间是基准方法的1/10。
- 单位