摘要

[目的/意义]通过在线工具来分析社交网络用户的语言和行为特征,对抑郁症患者进行预测性研究。[方法/过程]从推特上收集自我披露的抑郁症信息,提取抑郁症用户和正常用户在社交网络中的语言和行为特征信息。在对特征信息进行分析和验证的基础上,利用机器学习算法预测抑郁症用户。[结果/结论]研究发现,用户在社交网络上的语言和行为特征能够反映其心理状态,从中提取的各类特征可用于抑郁用户的检测。在抑郁症用户预测方法中,随机森林分类器的表现最好。基于Empath的词语类别特征在不同类型分类中具有最高的预测得分,而主题特征的得分排名较低。