摘要

目的 基于集成学习中的模型融合方法建立围绝经期综合征中医智能化诊断模型。方法 检索中国知网(CNKI)、万方数据知识服务平台(WF)、维普中文科技期刊数据库(VIP)、中国生物医学文献服务系统(CBM)以及古今医案云平台自建库至2022年5月20日收录的中医诊治围绝经期综合征的医案数据1021个,以此建立数据集。将1021个数据样本按7∶3比例分为训练集714个和测试集307个。利用随机森林、支持向量机、人工神经网络分别构建围绝经期综合征辨证诊断模型,通过各分类器模型学习数据集并进行预测。通过网格搜索法进行模型的超参数调优,然后通过异质集成的方法对三种分类器模型进行融合,组成一个强学习器,以准确率、精确率、召回率、f1分数、受试者工作特征曲线下面积(AUC值)等作为模型的评价指标。结果 分别构建了随机森林、支持向量机、神经网络、集成模型对其进行评估,其准确率分别为0.84、0.86、0.85、0.87;精确率分别为0.85、0.86、0.85、0.87;召回率分别为0.84、0.86、0.85、0.87;f1分数分别为0.84、0.86、0.85、0.87;AUC值分别为0.98、0.97、0.97、0.98。各指标均以集成模型最优。结论 集成模型能够综合各个弱监督模型的优点,具有更好的稳定性,其性能和泛化能力都优于单一学习器,其结果对于临床中医诊断具有重要的参考价值。

  • 单位
    山西中医药大学