摘要

针对电子警察采集数据存在的数据延迟、数据缺失和异常偏离三类常见问题,在保证数据未出现延迟和缺失时,基于马尔科夫模型判断数据的异常偏离;考虑流量序列间的关联关系,建立基于历史数据的转移概率矩阵,在此基础上利用马尔科夫模型进行流量概率分布预测,进而利用EM算法拟合概率分布得到对应的均值和标准差;根据模型预测结果和设定的流量合理分布阈值,以置信区间的形式直接判断流量的异常偏离情况。实例验证结果表明,基于马尔科夫模型的流量预测准确率达87%,异常偏离识别准确率为83%左右。