本文以UZI网站中收录的十组判断心脏病数据为调查对象,以心脏病预测为课题进行研究。首先介绍了心脏病的历史,国内外现状发展以及人们对心脏病预测的认识和研究的意义及目的。进而阐述了决策树的基本理论,包括结构及组成、预数据处理、决策树的建树、剪枝;然后以大数据分析为基础,合理地选择了决策树算法(主要为ID3和CART算法)为工具,尽可能找出最准确最合理的模型预测方案,同时结合交叉验证、拉普拉斯平滑检验和改进模型,找出最佳的心脏病预测的方案。