摘要
目的集成学习是近年来机器学习领域中被广泛应用的一种新的、用来提高学习精度的算法。本文旨在介绍基于super learner算法的集成学习方法在纵向删失数据预测建模中的应用及其R语言实现。方法本文介绍了super learner算法的基本原理及其在纵向删失数据建模中的应用,以及如何在R语言中实现该算法的建模。其次,应用TCGA数据库中的肿瘤生存数据进行实例分析,展示其在实际数据分析中的应用效果。结果基于super learner算法的集成学习方法在建模时,模型参数估计方法的选择和算法参数的定义均较为灵活。在实际数据分析中,super learner算法可以充分利用所获得的数据建立模型,模型的预测准确度为0.873 7(95%CI:0.789 7~0.933 0),C-index为0.883,预测准确性较高。结论基于super learner算法的集成学习方法为纵向删失数据的预测建模分析提供了新的选择。
-
单位公共卫生学院; 西安交通大学