摘要
目的 发现影响肺癌发病的生活行为相关危险因素,并构建肺癌风险预测模型,识别人群中的高风险个体,帮助肺癌早期筛查。方法 本研究数据来源于英国生物样本库(UK Biobank)2006年3月–2010年10月收集的502 389名参与者。参考国内外肺癌筛查指南和高质量肺癌危险因素研究文献,确定本研究高危人群识别标准。采用单因素Cox回归分析及逐步回归筛选出肺癌的危险因素,通过Cox比例风险回归构建多因素肺癌风险预测模型,根据比较赤池信息准则以及Schoenfeld残差检验结果,最终选择等比例假设的最优拟合模型。多因素Cox比例风险回归考虑生存时间,将人群按7∶3的比例随机分为训练集和验证集,使用训练集建立模型,并用验证集对模型性能进行内部验证。受试者工作特征曲线(ROC)曲线的曲线下面积(AUC)被用于评估模型的效能。将人群按照发病概率的0%~<25%、25%~<75%、75%~100%分为低风险、中风险及高风险人群,分别计算其中的发病人数占比。结果 本研究最终纳入453 558人,在累计随访5 505 402人年期间,共诊断出2 330例肺癌。Cox比例风险回归分析筛选出10个自变量建立模型:年龄、体质量指数(body mass index, BMI)、学历、收入、体力活动情况、吸烟状态、饮酒频率、新鲜水果摄入量、癌症家族史、烟草暴露。该模型通过内部验证结果显示8个自变量(除BMI和新鲜水果摄入量外)均是肺癌的影响因素(P<0.05)。该模型训练集预测肺癌发生的一年、五年、十年AUC分别为0.825、0.785、0.777;验证集预测肺癌发生的一年、五年、十年AUC分别为0.857、0.782、0.765。筛查高风险人群可发现68.38%的未来肺癌发病个体。结论 本研究建立了大规模人群生活行为方式相关的肺癌风险预测模型,其在判别能力方面表现出良好的性能,为制定肺癌标准化筛查策略提供了工具。
- 单位