基于多特征的垃圾微博检测方法

邹永潘; 李伟; 王儒敬

doi:10.15888/j.cnki.csa.006014

摘要

随着微博平台的快速发展,垃圾信息检测与过滤也面临着巨大的考验,实时精确地识别垃圾信息对于提高用户的体验以及微博平台的可持续发展意义重大.本文根据新浪微博的真实数据,提出了一种基于多特征的垃圾微博检测方法.首先,提取微博的显式特征(用户特征、内容特征);然后利用文档主题生成模型(LDA)提取微博中的隐含主题特征;最后根据所提取的微博特征利用支持向量机(SVM)构建分类器.实验结果表明,该方法相比于现有方法在准确率和F1值方面都有一定的提升.

单位
中国科学技术大学; 中国科学院合肥物质科学研究院; 合肥智能机械研究所

全文

访问全文

收藏分享被引浏览

更新时间：2024-05-12 05:20

基于多特征的垃圾微博检测方法

摘要

全文

产品服务

站内浏览

服务支持

联系方式

科研之友