摘要
为了提高肝病预测准确率,提出一种基于K近邻-随机森林算法的肝病预测集成模型。首先对UCI数据集中的印度肝病数据集进行数据预处理;然后分别采用K近邻和随机森林算法构建出肝病预测的弱分类器;最后将两个弱分类器利用voting策略进行集成以获得集成肝病预测模型。同时分析了特征对模型的贡献程度。实验结果表明模型的性能指标F1-分数取得了84%的良好表现。因此利用该集成模型可为医生的临床诊断提供支持。
-
单位生物医学工程学院; 中山大学新华学院