摘要
为了实现宫颈癌的早期筛查与诊断,使用来自丹麦Herlev大学医院的宫颈细胞图像数据集,训练了D-LinkNet语义分割神经网络,用来分割宫颈细胞图像中的细胞核、细胞质和背景。使用OpenCV,从分割之后的细胞图像中,提取几何、色度和纹理三大类共75个特征。使用Scikit-Learn搭建了使用单一算法的分类器和集成多个算法的投票分类器,对正常和异常的宫颈细胞进行二分类。将提取到的特征数据按照4:1的比例分为训练集和测试集。结果显示:集成了多种分类算法的投票分类器在测试集上的分类效果最好,获得了0.9334的分类准确率。
- 单位