摘要

目的 探索采用机器学习算法,在保证准确度的前提下,结合年龄和性别因素,简化焦虑自评量表(SAS)和抑郁自评量表(SDS),提高筛查效率。方法 在获得SAS和SDS数据的基础上,采用随机森林的算法和前向选择的特征选择方法构建模型,并通过五折交叉验证将简化后的量表测试结果与真实测试结果进行对比验证。结果 有无焦虑的人群SAS各条目评分比较差异均有统计学意义(P<0.001),有无抑郁的人群SDS各条目比较差异均有统计学意义(P<0.001)。SAS可以由原来的20个条目减少到8个,预测准确度可以达到95.03%;SDS可以由原来的20个条目项减少到8个,预测准确度可以达到95.54%。然而年龄和性别未能被机器学习算法纳入为重要指标。结论 采用机器学习的方法能在保证准确度的前提下,有效减少问卷条目,达到缩短测试时间,并对焦虑或抑郁状态有效识别的目的。

  • 单位
    深圳市光明区疾病预防控制中心; 深圳大学