摘要
提出一种面向大规模数据的特征趋势推理算法。首先,采用Hash函数抽取大规模数据样本,使用Pam聚类算法和并行K-means聚类算法对大规模数据样本进行聚类,获取最佳聚类结果后,提取大规模数据聚类的动态特征;其次,采用基于特征趋势规则的推理算法,构建大规模数据特征的趋势规则推理模型,并通过累计趋势规则方法设计趋势规则算法,推理大规模数据特征趋势,解决了推理结果误差较大的问题。实验结果表明,该算法对大规模数据特征趋势推理的准确率均值为98.10%,推理速度增长率为50%,推理耗时最大均值仅为114.25s,能快速准确地完成数据特征趋势推理。
-
单位阳光学院