摘要

目的 探讨当连续型自变量和logitπ不满足线性关系时,不同数据离散化方法的优劣,为logistic回归分析中连续型自变量离散化处理提供参考。方法 运用R软件,采用病例对照研究从效应量、自变量个数、样本量3个角度产生模拟数据,进一步对连续型自变量采用不同离散化处理后拟合logistic回归模型,比较不同方法拟合效果。结果 不同模拟数据集研究结果均显示,4种连续型变量处理方法拟合logistic回归模型时,“OR值最大化分类法”能更好地筛选出对结局变量有影响的自变量,并且其模型拟合效果亦最好,表现为其AIC最小,Nagelkerke R2最大,正确合计率也较高。结论 当连续型自变量与logitπ之间呈非单调变化关系时,在拟合logistic回归模型时建议使用双界点OR值最大法对数据进行离散化。