摘要
本文采用数据挖掘算法对山西人口膳食习惯对慢性代谢疾病的影响分析,将文献与山西实际结合,设计调研问卷,通过问卷星平台向我省居民进行线上线下随机调研,对收回的数据在预处理的基础上,使用逻辑回归和关联算法采用python语言编程,提取影响糖尿病、高血压、高脂血症、脂肪肝等慢性代谢疾病的有效特征并分析特征与疾病之间存在的关联关系。结果本研究共设计了包含个人基本情况、饮食习惯、其他生活习惯及健康认识等四个方面88个问题的调研问卷,对收回的数据在缺失数据处理、规范化标准化等预处理的基础上,分别提取了影响糖尿病、高血压、高脂血症、脂肪肝的21、13、20、13个有效特征,经过关联算法分析了与糖尿病、高血压及高脂血症有关的饮食及生活习惯关联规则各6条。结论:合理膳食、适量运动、戒烟限酒、保持良好的作息规律是维护健康的重要因素。
-
单位山西中医药大学