摘要
为提升冠状动脉粥样硬化性心脏病的防治水平,赋能智慧医疗,以心内科医疗信息化数据为对象,对冠状动脉粥样硬化性心脏病早期预测方法展开研究。阐述了从医疗信息系统中采集模型所需样本的数据筛选、数据清洗、文本预处理、文本表示以及特征归一化方法流程,提出了一种基于粒子群优化的随机森林预测方法。该方法以k折交叉验证平均准确率为目标函数,能够自适应优化随机森林的模型参数,从而提升模型的分类能力。实验结果表明,在真实世界冠心病数据的预测上,该方法具有较高的预测精度,准确率为87%,灵敏度为87%,特异度为88%,AUC为0.91,较未优化的随机森林具有明显的提升。因此,对冠状动脉粥样硬化性心脏病的早期预测应用具有一定的参考价值。
-
单位上海交通大学医学院附属仁济医院; 万达信息股份有限公司