摘要
在数据库系统和云计算环境中运行并行负载是一种常态,这些系统需要满足其服务等级协议(Service Level Agreements,SLA).响应时间是系统调度负载并满足SLAs的最重要的指标,准确预测数据库系统并行负载(查询)的响应时间必须要考虑并行执行的查询之间的相互影响—查询交互.目前基于查询交互的查询响应时间预测方法主要以实验驱动的方法建模,需要大量的实验采样.由于数据量的爆发式增长导致负载运行时间不断增长,进行一次完整的建模所需的开销非常大.合理减少建模所需采样数目,可以有效降低建模所需成本和提高建模效率.本文基于查询交互的BAL(Buffer Access Latency)模型提出一种采样策略[1],在不运行样本的情况下,使用已有的测量结果预测样本运行的响应时间,并依据预测对全样本空间聚类,然后根据聚类结果进行采样.实验表明,此方法相比常用的拉丁超立方抽样方法减少33%样本数目,并且保持了模型的预测精度.
- 单位