摘要
深度学习模型有时会将一些未知类别数据误分类为已知类别,这些未知类别数据定义为在某些领域的分布外数据,例如生物信息、医疗保健、自动驾驶和网络安全等,这样的误分行为将会导致严重的后果。对网络流量识别与分类技术以及分布外数据进行了简要介绍,提出了一种在测试样本中检测存在分布外数据的方法。根据分布外数据特点,通过训练并计算2个模型得到的结果的似然比判断分布外数据。在网络流量公开数据集Moore数据集和4个自采集数据集上进行了测试,该检测方法的识别精度可以达到92.3%。
-
单位哈尔滨工业大学; 国家计算机网络应急技术处理协调中心