摘要

本文针对临床疾病预测过程中医疗临床数据特征因子相关性较强,模型调参工作较为复杂的问题,提出一种多模型复合优化方法。考虑到过多的强相关性特征因子很容易降低模型的运行效率,利用SelectKbest变量筛选算法对临床数据进行筛选,采用遗传算法对随机森林分类器模型的参数选择进行优化。最后,以乳腺癌的临床数据为例,实验证明通过以上方法优化后算法模型的精准值、召回率、F1分值、AUC值等方面均有提高,该提出的超参数调优方法为具有强共线性的临床数据处理和疾病预测提供了一种新思路。