基于特征权重的恶意软件分类方法

作者:叶彪; 李琳; 丁应; 宋荆汉; 万振华
来源:计算机技术与发展, 2022, 32(11): 115-120.
DOI:10.3969/j.issn.1673-629X.2022.11.017

摘要

近年来由于计算机和人们的工作生活结合得更加紧密,为保障信息安全,恶意软件分类的重要性与日俱增,但是现有的恶意软件分类方法大多都存在模型复杂、耗费时间长以及效果不突出等困境。为提高恶意软件分类效率,提出一个结合特征提取和卷积神经网络的恶意软件分类框架。针对目前恶意软件分类算法准确率低、处理时间慢等问题,引入并改进了NLP领域中的一种特征权重算法。通过计算操作码的特征权重,选取具有较大信息增益的操作码作为特征词,然后提取恶意样本的特征图,最后传入卷积神经网络进行训练和分类。实验结果表明,该方法在big2015数据集上的准确率为99.26%,比基于TFIDF特征提取的方法略好,接近该数据集上的冠军方法,在不均衡类别上的分类表现优于基于频率的特征词选择的提取算法,并且在预处理时间上短于其他方法。

  • 单位
    武汉科技大学; 上海航天精密机械研究所; 智能信息处理与实时工业系统湖北省重点实验室

全文