文章对于传统挖掘算法在数据量级方面的不足之处,提出依托粗糙集原理的海量数据挖掘算法,重点探究基于动态聚类的两步离散化算法,如果算法满足大数据处理要求后,通过并行计算提升所用算法执行效率。在此基础上,选取实例证实算法可行性,测试结果表明,改进算法有利于处理海量数据,并解决海量数据处理带来的效率问题。