摘要

复杂疾病的预测是遗传学研究的一个重要课题。本文引入机器学习的方法,将临床变量与遗传变量作为特征,对骨质疏松性骨折进行预测研究。对临床表型和遗传变异数据进行特征选择后分别使用Logistic回归分析法、XGBoost算法对临床因子特征变量、临床因子+遗传因子特征变量进行预测;最后,使用十折交叉验证法,对预测结果进行验证。实验结果表明,相较单独使用临床因子进行预测,加入遗传因子变量,XGBoost、Logistic方法的预测准确率均得到提高;另外,XGBoost方法较Logistic回归模型预测效果更好。