面向AI模型训练的DNS窃密数据自动生成

冯林; 崔翔<sup>*</sup>; 王忠儒<sup>*</sup>; 甘蕊灵; 刁嘉文; 韩冬旭; 姜海

doi:10.19363/J.cnki.cn10-1380/tn.2021.01.01

摘要

近年来,借助DNS协议良好的隐蔽性和穿透性实施数据窃取已成为诸多APT组织青睐的TTPs,在网络边界监测DNS流量进而精准发现潜在攻击行为已成为企事业单位急需建立的网络防御能力。然而,基于DNS的APT攻击所涉及的恶意样本存在难获取、数量少、活性很低等现实问题,且主流的数据增强技术不适合移植到网络攻防这个语义敏感领域,这些问题制约了AI检测模型训练。为此,本文基于DNS窃密攻击机理分析,并结合了大量真实APT案例和DNS工具,提出了一种基于攻击TTPs的DNS窃密流量数据自动生成及应用方法,设计并实现了DNS窃密流量数据自动生成系统—MalDNS,以生成大规模、高逼真度、完备度可调的DNS窃密数据集。最后,通过实验验证了生成流量数据的有效性,以及对检测模型训练的有效支撑。

单位
中国科学院信息工程研究所; 广州大学; 北京邮电大学

全文

访问全文

收藏分享被引浏览

更新时间：2024-04-17 16:07

面向AI模型训练的DNS窃密数据自动生成

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友