摘要
加密货币挖矿恶意软件由于其高盈利性和匿名性,对计算机用户造成了巨大威胁和损失。为了对抗挖矿恶意软件带来的威胁,基于软件静态特征的机器学习检测器通常选取单一类型的静态特征,或者通过集成学习来融合不同种类静态特征的检测结果,忽略了不同种类静态特征之间的内在联系,其检测率有待商榷。该工作从挖矿恶意软件的内在层级联系出发,自下而上提取样本的基本块、控制流程图和函数调用图作为静态特征,训练三层模型将这些特征分别嵌入向量化,并逐渐汇集从底层到高层的特征,最终输入分类器实现挖矿恶意软件的检测。为了模拟真实环境中的检测情形,该工作先在一个小的实验数据集上训练模型,再在另一个更大的数据集上测试模型的性能。实验结果表明,三层嵌入模型在挖矿恶意软件检测上的性能领先于近年提出的机器学习模型,在召回率和准确率上分别比其它模型提高了7%和3%以上。
- 单位