摘要

多种慢性疾病若不能得到有效诊断和治疗会引发综合征,因此疾病的早期识别和诊断在临床实践中发挥着重要作用。目前提出的模型都假设用于训练模型的数据是完美的,而现实的医学数据中通常存在大量的缺失值和类别不平衡,这两个问题严重阻碍了模型的预测能力。为此,以糖尿病为例提出了一种基于集成学习的疾病预测模型,并且在评价模型的过程中采用了临床诊断试验的实际度量指标。在公开的皮马印第安人糖尿病数据集上的实验结果表明所提模型优于已有模型。另外,所提模型还可以用于其他疾病的预测。

  • 单位
    山西医科大学汾阳学院; 北方自动控制技术研究所