摘要

随着Internet的迅猛发展和日益普及,各种数据信息急剧膨胀,各行各业积累的数据量急剧增长,如何从海量的数据中提取有用的信息成为当务之急。文章讨论海量数据处理中的机器学习算法——关联规则挖掘Apriori算法,针对Apriori算法需要多次扫描数据库的缺点,对数据库进行划分,从而提高海量数据挖掘的效率。

全文