Hadoop平台是一个分布式生态系统,具备成本低、高效率、高扩展、高可靠、高容错等特性.文章充分分析了Hadoop平台生态系统,并将其运用在数据挖掘算法中,提出了聚类数据挖掘算法,利用簇众数代替中心节点,提高了算法挖掘效率,具备较好的自适应性.此外在数据挖掘中,朴素贝叶斯算法完成分类过程,挖掘效率更好,时间效率也更好.