摘要
在云计算环境下多来源数据最优选取过程中,来自不同的服务器数据具有不同特征,数据所含信息的融合度也不同,使得数据可选取特征存在较强的关联性.传统依的数据最优选取模型,在进行选择时,这种关联性会给最优数据的选择带来干扰,选出大量的相关数据,不能很好的排除关联性数据的排除,无法实现数据的最优高效选取,提出一种依据数据估计量变化的云计算环境下多来源数据最优选取模型,利用前几点数据拟合直线或曲线,进行云计算环境下多来源数据最优选取中干扰数据的预测,分析干扰数据点删除前后推断统计量的变化,检测该干扰数据点是不是强干扰点,过滤该强干扰数据点后的模型则是云计算环境下多来源数据最优选取模型,通过分析数据排除模型引起的估计量的变化,实现云计算环境下多来源数据的最优选取。仿真实验结果说明,在大量云计算环境下多来源数据的处理中,采用所提模型可有效选取最优数据,并且具有较高的准确率。
- 单位