摘要

软件漏洞是终端安全事件的根本原因,软件漏洞会造成隐私信息泄露问题。为进一步增强软件的安全性,提出一种基于机器学习的软件多类漏洞并行挖掘方法。将软件脆弱性历史数据中漏洞代码函数、参数、目标变量等映射到符号名称域中,并对其归一化处理,建立由基类、子类、代码类组成的多类漏洞信息资源库,统一漏洞编码命名。根据机器学习中KNN算法深度聚类待挖掘软件特征,计算任意二者间欧式距离。将相似度最大特征所属关键节点定义为软件漏洞。经仿真证明,所提方法特征分类精度更高,且软件漏洞挖掘的F1值可保持在0.88以上,对于不同数据集,研究方法的AUC值更高,挖掘误报率低,能够实现多种软件漏洞同时挖掘任务。

  • 单位
    郑州科技学院; 阜阳师范大学