摘要

为了研究XGBoost算法在乳腺癌诊断中的应用,将机器学习算法与疾病诊断相结合,提升乳腺癌的诊断效率与准确率。在公开的威斯康星州乳腺癌数据集中建立了XGBoost乳腺癌诊断模型,实验过程中通过网格搜索和学习曲线寻找诊断模型的最优参数,并将建立的XGBoost模型与决策树、支持向量机、K-近邻和朴素贝叶斯算法的预测效果进行比较,使用准确率、F1值、AUC值等评价指标来比较各个模型的预测性能。本文实验结果表明,XGBoost算法的五折交叉验证准确率达到了97.89%,优于其他单分类器算法,对提升乳腺癌诊断准确率具有现实意义。