摘要
由于传统方法在数据挖掘中应用效果不佳,不仅挖掘信息增益值比较低,而且数据挖掘耗时比较长,无法达到预期的数据挖掘效果,提出机器学习算法在数据挖掘中的应用。采用随机森林去重算法对大量的已有数据进行去重抽样,采用数据缺失插补技术对随机抽取的数据样本进行插补处理,补充数据缺失值,通过数据特征规则抽取查找出数据之间的关联规则,根据关联规则利用机器学习算法对数据分类挖掘,以此完成基于机器学习算法的数据挖掘。经实验证明,设计方法挖掘信息增益值在0.9以上,数据挖掘耗时在1s以内,在数据挖掘领域具有良好的应用前景。
- 单位