摘要

因传统信息分类方法在面向大数据时,普遍存在分类时间较长、平均误分率较高的问题,不能有效区分不同信息类型,提出一种面向大数据的规则引擎驱动下信息分类方法。通过对规则引擎下的大数据信息进行分析,构建大数据信息集模型,获取大数据信息特征。将大数据信息特征输入到支持向量机分类器中,以大数据信息分类正确率作为适应度函数,采用粒子群算法对支持向量机参数进行优化选取,根据选取结果实现信息的初步分类,根据初步分类结果运用数据概化理论实现信息属性的最优分类。实验结果表明,所提方法的平均误分率较低,分类所用时间较短,并且能够有效划分大数据信息类型,分类结果具有较高的可靠性。