新的基于融合向量的DGA域名检测方法

作者:李晓冬; 李育强*; 宋元凤; 侯孟书
来源:计算机应用研究, 2022, 39(06): 1834-1844.
DOI:10.19734/j.issn.1001-3695.2021.11.0596

摘要

由于词典类DGA域名的字符分布随机性低、单词组合随机性高,基于传统机器学习的恶意域名检测方法难以识别,虽然利用LSTM等深度学习的检测方法能捕捉域名字符序列特征,但缺乏局部词根组合特征,检测准确率低。针对以上问题,提出一种基于融合嵌入层的DGA域名检测方法。在域名词嵌入阶段,基于分词技术进行字符和词根的融合嵌入向量表示,结合一维卷积神经网络(CNN)和双向门控循环单元(BiGRU)构建混合的深度学习模型,实现DGA域名检测。实验表明,该方法与单一采用CNN或LSTM模型相比,在域名二分类任务中的准确率分别提高3.1%和4.3%,针对词典类DGA家族matsnu、suppobox、ngioweb的检测具有更高的精确率。

全文