摘要

准确量化虚拟机特征和性能之间的依赖关系,并预测特定特征配置下的虚拟机性能,是虚拟资源细粒度分配的基础.然而,传统贝叶斯网(Bayesian Network,BN)虽然能够表达虚拟机特征和性能之间的不确定性依赖关系,但当某组虚拟机特征配置未出现在训练集中时,BN便无法预测该配置下的虚拟机性能.此外,当虚拟机特征配置组合情况过多时,会导致虚拟机性能节点出现组合爆炸的情况.为此,本文提出一个带分类参数的BN模型.该模型首先利用随机森林分类算法,对虚拟机进行分类,然后根据分类结果和对应性能值,构建一个带分类参数的BN模型,从而实现任意特征配置下的虚拟机性能预测.同时,也降低了由于组合爆炸而带来的性能预测困难.实验结果表明了本文提出方法的有效性和准确性.