摘要

在工业互联网中,面对恶意软件的数量、种类的不断增加,传统的恶意代码检测方法存在诸如准确率低、时间开销大、数据预处理过程复杂等问题。结合神经网络在图像分类方向的成熟应用,提出了一种基于代码可视化的工业互联网恶意代码检测方法(Malicious Code Detection Based on Code Visualization, MCDCV)。首先,通过可视化算法将恶意代码原始文件转化为彩色图像,使用改进GoogLenet检测并识别恶意代码家族。其次,使用数据增强扩充原始样本集,并且提出了适用于多分类任务的带权Focal loss损失函数,通过使用样本期望体积来调整不同恶意代码家族在模型训练过程中的权重参数,缓解模型过拟合的影响。最后,通过在Malimg和Leopard Mobile两个数据集上进行实验,结果表明:彩色恶意代码图像在准确性方面要优于恶意代码灰度图,此外,该方法在Malimg和Leopard Mobile数据集准确率分别达到98.26%和97.19%,表明该方法能够有效检测工业互联网中的恶意代码。