摘要

随着互联网的普及、信息技术的飞速发展,信息安全的问题也日益严重,恶意代码是其中主要威胁之一。当前恶意代码呈现出数量巨大,技术不断更新的现状,恶意代码检测技术面临严峻挑战。因此,文中提出了基于指令序列特征和深度置信网络的恶意代码检测方法,它包括三个部分:样本预处理模块、特征构造与约简模块以及深度置信网络分类模块。数据预处理模块使用PEID、VMUNPACKER对恶意代码样本进行查壳、脱壳处理并用IDA pro对样本进行反汇编获取操作码;特征提取模块使用n-gram窗口滑动获取特征并采用信息增益的方法对特征进行选择;深度置信网络模块使用深度置信网络(DBN)在训练集上进行训练生成深度学习网络,再使用训练好的网络对样本进行分类与检测。实验结果表明,该方法相较于传统的恶意代码检测方法,检测速度和效率有较大的提高。