摘要

背景 听力受损在职业人群中具有较高的检出率,而通过早期监测可对其进行有效预防。目前关于该疾病的风险评估研究尚有空缺。目的 构建石油工人听力受损的风险评估模型,通过对模型的性能进行评价以获得适用于石油工人听力受损的最优评估模型。方法 本研究采用现况研究,共纳入2018—2019年某石油企业1 423例在华北石油管理局井下医院参加职业健康体检的工人,收集其一般资料、听力学检查、实验室检查结果,采用多因素非条件Logistic回归探讨石油工人听力受损影响因素。结合相关文献综述和专家意见确定模型的输入变量,应用Python构建随机森林、XG Boost和BP神经网络模型,采用受试者工作特征(ROC)曲线评价模型的判别能力,用校准曲线检验模型的校准能力。结果 不同年龄、性别、家庭月收入、糖尿病史、劳动强度、体育锻炼情况、耳毒性化学毒物暴露情况、睡眠障碍、倒班情况、高温暴露情况的石油工人听力受损检出率比较,差异有统计学意义(P<0.05),随着工龄和累积噪声暴露量的增加,石油工人听力受损检出率增加(P<0.05)。年龄≥50岁、糖尿病、耳毒性化学毒物暴露、失眠、倒班、工龄≥30年、累积噪声暴露量≥90 dB(A)·年是石油工人听力受损的危险因素(P<0.05),家庭月收入≥11 000元、中等劳动强度是听力受损的保护因素(P<0.05)。随机森林、XG Boost和BP神经网络模型判断石油工人听力受损的准确率分别为95.99%、95.22%和88.62%,灵敏度分别为91.43%、89.09%和70.13%,特异度分别为97.69%、97.50%和95.47%,约登指数分别为0.89、0.87和0.66,F1分数分别为0.74、0.73和0.73,ROC曲线下面积(AUC)分别为0.95、0.93和0.83;Brier得分分别为0.04、0.04和0.11,观察-期望比率分别为1.02、1.04和1.21,校准曲线的截距分别为0.029、0.032、0.097。随机森林模型的校准效能最优。结论 随机森林模型的性能优于XG Boost模型和BP神经网络模型,能够较准确地评估石油工人听力受损的风险。