摘要
针对用电信息采集统一接口平台需要大量包含足够测试用例占比的测试数据这一难题,提出基于改进遗传算法的用电信息采集系统统一接口平台测试数据集的生成方法;在对原始数据预处理的基础上,采用基于相似度的交叉算子对原始群体扩充,使用提出基于群体趋势不变的染色体变异算法,在保持群体数据集特性的情况下增大测试用例占比,从而形成测试数据的自动生成方法;应用该测试数据集生成方法,基于某省级电力公司2016年7—9月300万个典型用电客户用电数据进行数据集生成实验,利用熵原理比较无变异因子、插值法变异和改进遗传算法分别生成的测试数据与原始数据的重合度。结果表明,改进遗传算法生成的测试数据集,具有同用电信息采集系统采集数据相同的属性和属性值分布以及类似的属性关联关系,能够满足测试用例需求。
-
单位浙江省电力公司电力科学研究院; 中国电力科学研究院