摘要
针对社交媒体中潜在的自杀倾向问题,本文以新浪微博为研究对象,依据领域知识设计分层分类方案,并基于该分类方案,提出了分层支持向量机的分类模型。该模型对高自杀风险群体进行早期识别,可用于自杀倾向检测和干预,减少自杀现象。实验过程中分层地进行参数优化,降低了不平衡数据对实验结果的影响。综合考虑用户的情感状态,不断对情感词典进行扩充。实验结果表明:该模型对自杀群体的预测准确率达到0. 848,可有效地对微博用户的自杀倾向进行预测,同时发现微博发布时间和自杀风险概率之间存在可用正态曲线拟合的关系。
- 单位