摘要

目的 使用数据挖掘技术研究肝功能检查数据,分析肝功能检查指标与肝癌诊断的关联,探究肝癌早诊断、早治疗的辅助数据分析方法。方法 构建决策树C4.5模型并提取决策方法,并以Bagging方法优化;采用网格划分法和粒子群优化算法优化支持向量机模型;构建多层感知机(MLP)和卷积神经网络(CNN)进行性能比较。基于决策树和SVM模型进行特征属性分析和最优特征子集选择。结果 Bagging决策树模型、SVM、MLP模型的10交叉检验准确率分别为95.18%、95.60%、90.17%,测试准确率分别为94.34%、93.40%、89.78%。在肝功能检查指标中,碱性磷酸酶、谷丙转氨酶、天门冬氨酸转氨酶、年龄、直接胆红素是主要贡献指标,三指标联合诊断对肝癌预测率达86.08%。结论 决策树、支持向量机、多层感知机建立的肝癌分类器模型都可用于肝癌辅助诊断,SVM模型略优,预测模型对肝癌早期鉴别有较好的辅助作用。