摘要
在大规模数据中包含过多的冗余信息,当前算法表达事物不够清晰,导致数据信息不能够完全被挖掘,操作效率过低。为此,提出了基于层次频繁模式树设计数据的自动挖掘算法。基于层次频繁模式树定义挖掘任务,以候选集剪枝思想建立数据自动连接矩阵,利用最小支持度裁剪队列自动挖掘数据,完成基于层次频繁模式树的数据自动挖掘算法设计。实验结果表明:动车组的运维数据作为测试样本,分别对不同总量的数据进行挖掘,研究算法能够在规定时间内将数据表达完全,以200万条数据为例本文算法比传统算法的挖掘数量,分别超出了10万条和8万条,提高了其工作效率。
- 单位