摘要

收集乳腺癌的预后状况,通过Logistic回归模型、决策树和随机森林算法,分析比较不同变量对乳腺癌预后的敏感性,并比较特征变量的重要性。使用Logistic回归的多变量分析显示,年龄、N-stage、乳腺癌内分泌治疗、化疗手段、多灶性病灶、化疗与预后有关。随机森林分析的结果得到了各个因素指标的重要性评分,有助于正确选择高风险人群,有利于建立分类系统。通过该结果找到危险因素,建立较高准确率的预测模型,预测乳腺癌患者的生存能力,并可作为制定医疗决策的参考。根据患者的特征制定针对患者不同特征的个体化术后随访及辅助治疗策略,争取最大程度上预防乳腺癌的术后复发。