摘要
高性能计算集群通常使用先来先服务等传统的作业调度方法,它具有良好的公平性,并且实现简单,但容易产生闲置的资源碎片.针对上述问题,一种的策略是使用回填,利用一些短时间小作业来填补系统等待期间的空闲资源碎片.但好的回填方法通常需要知道作业预期的运行时间,而用户或者不愿意提供作业预期运行时间,或者倾向于提供比实际运行时间更长的预期时间以避免作业被系统终止,因此我们有必要自行预测作业的运行时间. VASP是国内应用最普及的高性能计算应用软件之一,本文通过分析VASP作业特性,解析并抽取相应的作业特征集,提出一种基于贝叶斯的二次预测模型IRPA,对VASP作业进行运行时长的预测,最后进一步提出基于径向基网络分支及贝叶斯分类的混合预测模型BRBF,并且利用我校TC4600平台上的VASP作业数据集进行验证.实验结果和其他几个基本方法进行对比,表明IRPA以及BRBF的有效性以及在粗粒度下具有的较高预测准确率.
- 单位