摘要

数据库系统的不同查询之间存在访问数据路径重叠和计算共享的可能,而工作负载中的查询分批处理称为多条查询一次执行(Multiple-Query-at-a-Time)模型。一些已开发的多查询处理框架已经被证明有效,然而都缺乏构建完整查询处理和优化方法的普适框架。在基于等价变换来构建查询时算子合并优化框架的基础上,提出一种面向异构架构的关系型算子并发计算框架OmegaDB。该框架通过研究面向GPU的关系算子流批计算模型并构建关系数据查询流水,在CPU-GPU异构架构上实现了聚合多查询的流批计算方法。在实验及原型实现上,通过理论分析和实验结果验证OmegaDB相对传统关系型数据库管理系统(RDBMS)所具备的优势,以及OmegaDB利用新硬件的潜力。根据基于传统关系代数规则的多条查询一次执行模型的查询优化框架的理论研究,提出多个优化方法并展望未来研究方向。使用TPC-H商业智能计算作为基准测试程序,实验结果表明OmegaDB与现代先进的商业数据库系统SQL SERVER相比,在消耗更低的磁盘I/O和CPU时间的情况下,最高可以达到24倍的端到端加速。