摘要

目前的深度学习模型在加密流量分类任务上取得了相对传统机器学习方法的显著性能优势,然而由于其固有的黑盒特性,用户无法获知模型作出分类决策的机理。为了在保证分类准确率的同时增强深度模型的可信度,提出一种面向加密流量深度分类模型的可解释方法,包括基于原型的流量层级主动解释和基于特征相似显著图的数据包层级被动解释。首先,利用基于原型的FlowProtoNet模型,在训练时自动提取各类流量的典型片段,即流量原型;在测试时给出待测流量与各类原型的相似度,可在分类的同时实现训练集的溯源解释。其次,为进一步提升视觉可解释性,提出梯度加权的特征相似度显著可视化方法 (Grad-SSM)。Grad-SSM首先通过梯度对特征图加权,过滤分类决策无关区域,然后计算待测流量与FlowProtoNet提取的原型之间的陆地移动距离(EMD)得到相似矩阵,通过比较测试流量与该类原型,实现注意力热图的进一步聚焦。所提方法在ISCX-VPNnonVPN数据集上,准确率达到96.8%,与不可解释的人工智能方法持平,而FlowProtoNet能通过给出与原型的相似度,进一步提供分类依据;同时,所提方法的可视化解释能力更强,注意力更聚焦于流量中的关键数据包。