摘要

针对当前恶意域名生成算法检测中存在着域名信息丢失、编码维度高、特征工程工作量大等问题,本文提出一种融合卷积神经网络和门控循环单元网络的DGA检测深度学习模型。该模型可以有效提取域名信息里隐藏的局部特征和上下文关联性特征,采用word2vec词向量嵌入方式,将域名转化为数据矩阵,获取域名信息,降低了因one-hot编码带来的高维度、计算量大问题。对比CNNLSTM模型减少了一定控制参数,计算速率上有明显提升。经实验验证,对于小样本DGA恶意域名数据集而言,本文方法在二元分类及多元分类上可以获取更好分类效果及更高分类准确率。

  • 单位
    中国刑事警察学院