摘要
目的:慢性化脓性中耳炎(chronic suppurative otitis media, CSOM)和中耳胆脂瘤(middle ear cholesteatoma,MEC)是两类临床上最常见的慢性中耳疾病。在诊疗过程中,该两类疾病因具有类似的临床表现,容易造成误诊及漏诊。高分辨率计算机断层扫描(high resolution computed tomography,HRCT)能清晰地显示颞骨的精细解剖结构,准确地反映中耳病变情况及病变范围,对慢性中耳疾病的鉴别诊断具有优势。本研究开发一种基于颞骨HRCT影像数据,对慢性中耳疾病实施自动信息提取与分类诊断的深度学习模型,旨在提高临床上对慢性中耳疾病的分类诊断效率,减少漏诊及误诊的发生。方法:回顾性收集2018年1月至2020年10月于湘雅医院耳鼻咽喉科住院的慢性中耳疾病患者的临床病历及颞骨HRCT影像资料。由2名经验丰富的耳鼻咽喉科医师独立审查患者的医疗记录,并对最终诊断达成一致结论。最终纳入499例患者(998侧耳),将998侧耳分为3组:MEC组(108侧耳)、CSOM组(622侧耳)、正常组(268侧耳)。使用不同方差的高斯噪声进行数据集样本扩增处理,以此消除组间样本数量的不平衡。经扩增后的实验数据集样本量为1 806侧耳,实验中随机选择75%(1 355侧耳)用于训练,10%(180侧耳)用于验证,剩余的15%(271侧耳)用于测试并评估模型性能。模型整体设计为串联式结构,设置具有3种不同功能的深度学习模型:第一种是区域推荐网络算法,从整体HRCT图像中搜索中耳部分的图像进行切割、保存;第二种是基于孪生网络结构的图像对比卷积神经网络(convolutional neural network,CNN),从切割好的图像中搜索与HRCT图像关键层面匹配的图像,并进行3D数据块的构建与保留;第三种是基于3D-CNN操作,用于对3D数据块进行分类诊断,并给出最后的预测概率。结果:基于孪生网络结构的特殊层面搜索网络在10个特殊层面上表现出了0.939的平均AUC值。基于3D-CNN的分类网络整体准确度为96.5%,整体召回率为96.4%,3种判类结果的平均AUC值为0.983。预测结果中的CSOM病例召回率为93.7%,MEC病例召回率为97.4%。在后续进行的对比实验上,一些经典的CNN平均精确度为79.3%,平均召回率为87.6%。本研究构建的深度学习网络的准确度比普通的CNN提升约17.2%,召回率提升约8.8%。结论:本研究构建的深度学习网络模型可以自动从患者颞骨HRCT影像数据中提取含有中耳特征的3D数据块,在降低数据整体规模的同时保存了对应图像间的关系,可进一步使用3D-CNN进行CSOM与MEC的分类诊断。该模型的设计很好地结合了HRCT数据的连续性,实验结果准确度高,适应性广,优于目前常用的CNN方法。
-
单位湘雅医院; 中南大学湘雅医院