摘要
本文基于统计学中的logistic回归,多元线性回归,逐步回归以及假设检验等理论知识,对从http://archive.ics.uci.edu/ml/datasets/Heart+Disease中获得的心脏病数据进行研究,选出影响心脏病各个阶段的因素,并建立统计模型。使用R语言统计软件,从原始的数据集中(294)随机选择大约10%数据(30)留作预测数据,264个数据用于建立模型,所建立的模型中包含33个变量。这264个数据的预测准确率为1,预留的30个数据预测,得到的准确率为70%。这个结果也能够很好的适用于临床的指导当中。