摘要

目的通过对比评估5个模型的性能,优选证候要素"气虚"的辅助诊断模型。方法从前期构建的证候要素-症状数据表中筛选与"气虚"有关的症状后,依据特征筛选出排序前15的症状。按照7∶3划分训练集和测试集,并进行重新采样。分别以最佳参数构建5个机器学习模型(CART决策树、随机森林、K近邻、BP神经网络和支持向量机),以ROC曲线下面积(AUC)值、敏感度和特异度作为模型评价指标。结果 15个关键症状包括疲乏,舌淡,神疲,脉弱,气短,自汗,食欲不振,脉细弱,懒言,苔白,便溏,苔薄,心悸,头晕,脉虚。基于随机森林算法构建模型的分类效果最好,AUC值达到0.923。结论在5个模型中,随机森林算法更加适用于构建证候要素"气虚"的辅助诊断模型。