摘要

随着ETL(Extraction-Transformation-Loading)系统的ETL任务量增多,难度更加复杂且波动增大,现有的ETL任务调度机制如时间片轮转法受限于弹性调度能力弱、效率低下等缺点难以满足调度需求。为研究如何提升ETL任务调度机制的弹性调度能力以及执行效率,提出了一种基于整合移动平均自回归模型(Autoregressive Integrated Moving Average, ARIMA)与GGA(Greedy-Genetic-Ant Colony Optimization)算法的ETL任务调度机制。初期建立ARIMA模型并弹性的结合贪心算法计算初始解;中期利用遗传算法的全局快收敛的特性结合初始解圈定最优解的大致范围;最后利用蚁群算法的局部快速收敛性进行最优解搜索。实验结果表明:该调度机制能够弹性的指导任务调度尽可能的找到最优解,减少任务的执行时间以及尽可能的负载均衡。

全文