摘要
慢性阻塞性肺疾病已经成为一个重要的社会问题.气流受限是慢性阻塞性肺疾病的最基本特征.而肺功能检查对评估气流受限程度具有重要意义.本文利用机器学习的方法,分析慢性阻塞性肺疾病患者肺功能检测指标,建立更加有效的判定及预测慢性阻塞性肺疾病的模型.首先,进行数据预处理,包括填补缺失值以及剔除脏数据.然后,利用因子分析、决策树分析及其优化方法,选取13个主成分,建立了最大树深度为3、最小父节点为10、最小子节点为10的慢性阻塞性肺疾病预测模型.最后,通过大量实验,验证本模型的有效性,预测慢性阻塞性肺疾病准确率达到83%,并且具有较好的稳定性.
-
单位山东师范大学; 计算机软件新技术国家重点实验室; 生命科学研究院