摘要
针对传统的JavaScript恶意代码静态检测所存在的样本标记工作量大,以及由于样本冗余度高、泛化能力不足所导致的分类精确度低的问题,提出了一种新的支持向量机的自主学习策略VASVM,通过价值度量的定义优化了最有价值样本的选择策略,同时结合迭代地调整训练集平衡度,提高了训练集泛化能力和训练过程的收敛速度。然后在此基础上利用NE-SVM算法对采用VASVM所选择的训练集进行剪裁以降低样本冗余度,并且进一步提高了泛化能力。最后得到了基于VASVM策略和NE-SVM算法所结合形成的NE-VASVM系统。实验结果表明,基于NE-VASVM的JavaScript恶意代码检测系统有效减少了人工标记工作量,提高了分类器精度。
- 单位