摘要

在对恶意代码进行检测和分类时,由于传统的灰度编码方法将特征转换为图像的过程中,会产生特征分裂和精度损失等问题,严重影响了恶意代码的检测性能。同时,传统的恶意代码检测和分类的数据集中只使用了单一的恶意样本,并没有考虑到良性样本。因此,文中采用了一个包含良性样本和恶意样本的数据集,同时提出了一种双字节特征编码方法。首先将待检测的PE文件特征编码为二进制数,从单个特征中取前两个字节,然后将所有字节转换为图像,最后通过卷积神经网络提取特征并在测试集上进行验证。实验表明,通过将待检测的PE文件的特征进行双字节编码处理,相对于同等条件下的灰度编码方法,其准确率从81.4%提升到92.82%。实验结果证明双字节特征编码方法能够有效地应用于恶意代码检测中。

全文