摘要
实时准确地测量高速网络中每条流的基数,对流量工程、异常检测及网络安全等领域来说至关重要。但网络处理器芯片中能够匹配流速处理需求的高速存储资源极度有限,无法满足流信息直接存储的需求,需要不同流共享同一段存储空间,利用紧凑数据摘要(Sketch)实时处理和存储流的基数信息。这种存储共享的方式使得不同流的信息混杂在一起,并在流基数估计的过程中引入了难以过滤的噪声。针对上述现有研究中普遍存在的问题,提出了一种基于深度学习的高速网络流基数估计算法。所设计的算法改进了已有研究的实时数据包处理和存储更新规则,设计了一种更为高效的编码方法在存储共享的基础上尽可能地减少噪声,并利用深度学习模型来学习每条流编码数据中的潜在模式以提高基数估计的性能。实验结果表明,所提出的方法相较于已有最新研究成果具有更高的精度和更低的存储开销。
- 单位