摘要

现有基于Transformer的神经网络在自然图像领域取得了非凡的性能,并全面超越了卷积神经网络的效果。由于其引入了多头自注意力机制,能够很好地建立像素间长距离依赖的全局信息,其在医学图像分割中同样十分重要。因此,文章尝试探索Transformer在医学图像上的表现,并设计了基于Transformer的分割网络Trans-SegNet。Trans-SegNet在编码器与解码器之间插入全局融合模块,捕捉全局依赖和上下文信息,提取强表示能力的特征。其中包括Transformer中的多头注意力机制,建立长距离依赖和频域表示学习模块在频域视角完善全局上下文语义。该算法在脑肿瘤分割数据集BraTS2019上进行实验和评估,结果表明,Trans-SegNet相比卷积神经网络U-Net性能取得较大提升,其中ET提升2.07%、WT提升0.98%和TC提升1.89%,证明了Transformer结构和所设计算法在脑肿瘤图像分割的有效性,为医学图像分割辅助诊断的应用提供了借鉴。

全文