摘要

随着互联网的爆炸式的发展,计算机病毒也是层出不穷,如何快速的对新增病毒进行响应和查杀也是一个较大的挑战[1]。普通的特征检测方法对于新样本的检测存在滞后性,往往无法有效查杀新增样本。通常的机器学习查杀病毒,则存在特征难以提取,训练集样本不均衡的问题。本文中提出一种方法,通过CNN算法和文件图像化表示算法结合进行病毒扫描的方法。本文中发现,通过CNN,可以有效的提取文件图像化后的特征,达到了自动提取特征的目的。修改了CNN中softmax算法,从而解决了样本不均衡问题。