基于改进随机森林集成模型的疾病风险预测

作者:李丹; 卢琰; 吴佩珊; 李春玲; 杜宝林
来源:实验室研究与探索, 2023, 42(09): 95-99+109.
DOI:10.19927/j.cnki.syyt.2023.09.020

摘要

针对疾病样本数据集不均衡以及传统模型预测精度低等问题,提出一种混合随机森林与人工神经网络(ANN)的集成预测模型。采用少数样本合成过采样技术(SMOTE)构建平衡训练数据集;结合随机森林特征选择优势和ANN的预测能力,通过集成方法构建混合随机森林与ANN的集成预测模型SMOTE-HRF-ANN以对畜禽疾病风险进行预警预测;将多种预测模型进行对比实验。实验结果表明,该模型能有效提高疾病预测的精准度与召回率,在少数类样本中的精确率和F1-score值分别达到96%和85%。

全文