摘要
以往采用的基于秩和检验以及静态软件缺陷检测方法受数据集噪声影响较大,导致检测精准度较低,基于此,提出基于机器学习的软件运行缺陷检测方法。采用拉普拉斯特征映射的采样方式构建不同度量元特征向量的最近邻图,计算邻图中的权重矩阵,使样本平衡化。基于机器学习求取系数向量,计算每个类正则化残差值,由此分类。计算分类后的最小平均误差,分别研究赋值阶段和更新阶段的数据聚类程度。采用施瓦茨信息准则,对噪声敏感数据进行模糊处理,确定属性大于相对应阈值的数据即为软件运行缺陷。设定评价标准,进行仿真实验研究,由结果可知,该方法查准率和查全率均高于0.95,实验效果优于同类检测方法。
-
单位国家电网有限公司