摘要
在互联网+背景下,信息交流的方式发生了重大变革,并且在此过程中会产生非常庞大的数据,如何对这些数据进行挖掘和应用成为了一个研究热点。本文对数据挖掘中关联规则的相关概念进行了阐释,在此基础上对经典Apriori算法的思想进行了较为详细的分析,重点针对其性能缺点,从扫描数据量、候选项集、数据集划分三个方面给出了优化思路,并进行了详细描述、分析和对比,希望能够为同行业人员提供一定借鉴。
- 单位
在互联网+背景下,信息交流的方式发生了重大变革,并且在此过程中会产生非常庞大的数据,如何对这些数据进行挖掘和应用成为了一个研究热点。本文对数据挖掘中关联规则的相关概念进行了阐释,在此基础上对经典Apriori算法的思想进行了较为详细的分析,重点针对其性能缺点,从扫描数据量、候选项集、数据集划分三个方面给出了优化思路,并进行了详细描述、分析和对比,希望能够为同行业人员提供一定借鉴。