摘要

目的 基于来自临床的真实世界数据,探索机器学习模型在宫颈癌辅助诊断方面的性能表现,并讨论其后续在临床进一步推广的意义及可行性。方法 选取2018-01-12-2021-12-30在深圳市妇幼保健院(1 294例)、青岛大学附属医院(1 336例)和成都市妇女儿童中心医院(384例)等3家医疗机构收集的宫颈病变患者相关资料。以8∶2的比例划分训练集和验证集,通过5种机器学习算法建立相关宫颈癌辅助诊断模型,并评估比较模型的性能。结果 共纳入研究对象3 014例,宫颈上皮内瘤变(CIN)≥2级767例(25.45%),宫颈CIN<2级2 247例(74.55%)。经过K折交叉验证(K=5)选出最优参数建立相关辅助诊断模型,除决策树外,其余宫颈癌辅助诊断模型的性能均较好,其中神经网络模型性能表现最优,受试者工作特征曲线下面积>0.92。结论 神经网络等模型在宫颈癌风险辅助诊断方面性能表现较好,建议结合各个模型的优势和特点,充分发挥其临床作用和价值。

  • 单位
    北京协和医学院; 中国医学科学院; 公共卫生学院