摘要
为了有效利用云平台Hadoop框架的并行处理能力。通过对大数据挖掘技术中的传统关联规则算法-Apriori算法进行了分析和改进,提出了一种基于Map Reduce并行模式的改进数据挖掘算法,适用于医学大数据的分析和应用。首先通过布尔排列优化数据库中事务数据的存储方式,从而有效减少数据库被扫描的次数。然后采用关联规则优化减少Apriori算法中冗余的子集。为了验证改进算法的有效性,采用医学历史数据进行实验验证。最后仿真实验结果显示,相比传统的Apriori算法,提出算法的运行效率更高,具有较好的可靠性和有效性。
- 单位