摘要

为改善基层医疗机构儿童肺炎诊疗水平,提高基层医生分析临床医学影像的效率和质量,提出了一种基于Vision Transformer(ViT)的小儿肺炎辅助诊断模型。首先利用ResUNet对儿童胸片进行肺区域分割,将左右肺区域从胸片中分割出来以降低其他组织对肺炎诊断的干扰。然后,将分割后的图像输入改进的混合ViT模型进行诊断,该模型使用传统卷积神经网络的特征映射作为Transformer的输入,并在卷积神经网络中引入自注意力机制,增强卷积以加强其获取全局相关性的能力。最后,对卷积神经网络的骨干网络和Transformer模型进行端到端的训练,使模型能够达到良好的图像分类结果。在Chest X-Ray Images肺炎标准数据集上进行了实验,实验结果表明,所提模型的肺炎识别准确率、精确率和召回率分别达到97.27%、97.69%和98.60%。即该模型具有较好的可行性,可使基层儿童肺炎的临床诊断准确率得到很大提升。