摘要
针对基于小样本训练的机器学习模型对肺结节良恶性分类精确度不高的问题,本文提出了一种基于病理特征和改进随机森林的肺结节良恶性分类方法。首先利用灰度级转换、两次区域生长和一次腐蚀膨胀,将肺结节周围的CT图像数据完整地分割出来,保留了特征细节,然后提取了语义特征、形态学特征、图形学特征、临床特征组合而成的病理特征,接着选取不同的特征分别训练2种随机森林分类器,最后将2种分类器进行集成加权得到肺结节良恶性的分类结果。通过ROC曲线、AUC值和其他机器学习方法进行对比,表明本文的方法能有效提升肺结节良恶性的分类精确度。
- 单位