摘要

现代恶意软件多用变形和多态的方法躲避检测,导致恶意软件变种数量大幅度增加。反恶意软件今天面临的主要挑战是需要评估潜在的有恶意意图的大量的数据和文件,研究者每天收到大量的新恶意软件,并对它们进行分类,而后提取基于家族的特征。而传统的人工分类无论是在工作耗时还是在分类的准确程度都已经无法应对大量出现的新样本,并且人工的干预很难发现样本中隐藏的信息,因此高效自动化的恶意软件分类系统对反恶意软件的研究具有重大的意义。基于以上问题,提出了一种基于机器学习的多特征选择融合的高性能、高效率的自动分类系统。经过实验,系统达到了较低的对数损失0.006 4,并且提取特征的平均耗时仅需约6.5s,相比于单特征的系统在性能与效率上有了极大的提升。