基于扩展MDR方法的生存数据的特征选择

作者:田野; 侯婧雯; 王宗辉; 郑睿; 李若锦; 刘艳*
来源:中国卫生统计, 2022, 39(05): 663-668.
DOI:10.3969/j.issn.1002-3674.2022.05.005

摘要

目的 对比分析Surv-MDR、Cox-MDR、Cox UM-MDR和KM-MDR四种用于识别生存分析中SNP位点交互作用的算法,为寻找影响患者生存时间的交互SNP位点时算法的选择提供理论指导。方法 使用R 4.0.5完成四种算法以及模拟实验代码的编写,并使用ggplot2包绘制功效对比图;探索实际数据集上影响患者生存时间的交互SNP位点,并使用survminer包绘制相应的生存曲线。结果 在不同最小等位基因频率、遗传度下四种方法的效能不同。Cox-MDR受协变量影响最大;Surv-MDR和KM-MDR功效相近且整体表现最好,且KM-MDR具有更好的稳定性;CoxUM-MDR功效强于Cox-MDR但受删失比例影响最大;在真实数据集上,Cox UM-MDR和Surv-MDR识别出了同一个有意义的一阶交互项,Cox-MDR和KM-MDR未能识别出有意义的交互项。结论 当不存在协变量时,CoxUM-MDR、Surv-MDR和KM-MDR功效都明显高于Cox-MDR,不宜选用Cox-MDR;当存在协变量且删失比例不高时,Cox-MDR功效高于其他三种方法,宜选用Cox-MDR;但随着删失比例的增加,宜选用CoxUM-MDR或Surv-MDR。

全文