摘要

为了提高对海量数据的检测过滤能力,提出基于概率数学模型的数据过滤方法,采用描述性统计分析方法构建大数据过滤的统计特征分析模型,采用高阶累积量进行数据过滤的概率密度特征统计量设计,结合模糊数学推理进行数据过滤的检测统计量分析,在海量数据环境下根据检测统计量分布的概率密度进行回归分析,采用阈值检验和门限判决方法,实现数据过滤。数据测试结果表明,采用该方法进行大数据过滤的准确性较好,数学模型的可靠性和收敛性较好。