摘要
受现代生物基因启发,SGLBRA将软件行为特征与生物基因对应,提出一种基于API的软件基因库构建识别方法。该方法摒弃了传统特征检测对二进制码匹配的检测方法,通过获得的软件DNA序列,结合BM算法优化ODN序列比对,利用gene-prefixspan算法对DNA序列进行频繁模式挖掘,分别获得不同种类且带有行为信息的软件基因并以此构建软件基因库gene-trie。通过基因比对算法提取样本的软件基因,并利用随机森林检测SGLBRA模型的准确性。实验表明该模型有较强的泛化能力,能够有效识别实验室现有恶意软件的变种测试集。