摘要

在近些年网络空间安全形势愈发严峻的情况下,对网络协议分析提出了越来越高的要求,其中,对未知协议分类分析更是亟需攻克的难点。针对未知协议的分类问题,提出一种基于层次聚类的多策略未知协议分类方法。该方法从传输控制协议头部特征、数据包的时空特征等维度入手,与马尔科夫链相结合,首先对收集到的网络数据进行预处理;然后提出可读性分类机制,并运用改进的层次聚类算法的多种聚类策略,发挥现代计算机的多核计算与单指令流多数据流优势;最后结合传输控制协议流中的二元组信息(目的 IP和目的端口),对聚类结果进行调整合并,得到未知协议网络数据的分类结果。据真实网络数据验证表明,该方法对未知协议的分类准确率达到96%以上。