摘要
目的大肠息肉和溃疡性结肠炎(ulcerative colitis, UC)是常见的大肠疾病,发病率高,检测需求大,且容易在临床中被漏诊和误诊。因此研究用于内窥镜大肠病变图像分类的计算机辅助诊断(computer-aided diagnosis,CAD)系统十分重要。局域约束线性编码(locality constrained linear coding, LLC)在图像分类领域展现了优异的性能,能够完成对内窥镜中病变图像的分类。但是由于肠胃内窥镜图像中存在的一些微小息肉等病理征状与肠壁十分相似,LLC在这一场景下的性能有待提高。方法由于码本的设计对细微差别检测能力影响大,本文通过改进LLC中的码本来实现更精确的大肠病变分类,其中原始码本被改进为带有先验权重影响的共享码本。主要思想是尝试尽可能多地使用代表私有部分的码本。本文方法重新排列了码本的列,将较少使用的原子排列在码本的后面,成为共享码本。并利用原子使用的频率计算权重,通过在线字典学习的方法,获得具有先验权重的共享码本。利用这一新码本对特征进行编码能实现更为高效精确的图像分类。结果为避免过拟合,将部分Kvasir数据集与部分医院合作数据集合并使用。实验在2 600幅内窥镜图像上进行正常、息肉和UC图像的三分类实验,与压缩感知空间金字塔池化(compressed sensing spatial pyramid pooling, CSSPP)方法、私有共享字典学习算法(category-specific dictionary and shared dictionary learning, CSDL)、环形空间金字塔模型方法 (circular inner ring partitioning,CIRP)、显著性和自适应局部约束线性编码(saliency and adaptive locality constrained linear coding, SALLC)和AlexNet迁移学习的网络比较,本文方法的总体分类准确率为93.82%,较对比方法分别高了2.33%、2.21%、1.91%、0.8%、0.07%。结论本文所提出的先验权重共享码本,综合了词汇袋模型和共享字典的思想,使得对内窥镜图像中相似图片的分类更加精确。
- 单位