摘要
近年来互联网的快速发展使我国网民人数急剧增加,部分网民通过微博、论坛、贴吧、bbs等应用程序使用文字、音频、视频、图片等发布自杀倾向信息。本文提出一种基于网民发言信息的自杀倾向行为检测技术,利用自杀倾向用户在网络上发布的文本信息,使用TF-IDF算法分析出自杀倾向的关键词,通过这些关键词在网络上爬取命中关键词的文本,利用机器学习算法将这些文本信息中具有自杀倾向的用户检测出来。分别对比SVM、KNN、NB、LR、DT、RF模型效果,实验结果表明RF模型效果最好精确率达85.1%。研究发现具有自杀倾向的用户敏感发言时间等信息对于检测自杀倾向也有很好的效果,通过加入这些指标,再次进行实验对比发现,自杀倾向检测的精确率达到了86.8%。
-
单位武汉邮电科学研究院