摘要

近年来,机器学习和数据挖掘成为大数据领域的一个重要研究热点。Spark并行处理框架是一个当今高速发展应用广泛的生态系统,是专为大规模数据处理而设计的快速通用的计算引擎。本文尝试使用逻辑回归算法,使用Spark对银行营销数据进行建模分析,根据得到的模型预测客户是否订阅存款业务。