摘要

目前现有技术在中文异常邮件过滤方面,存在误判、效率不高等缺陷。为了缓解此问题,结合随机森林算法的优点,采用了中文分词方法进行特征提取,并对词频进行权重计算,通过奇异值降解,更好地填充算法以完成对中文异常邮件的检测。多种算法的对比分析检测效果表明,提出的基于随机森林异常邮件检测器在精准度、召回率的性能均优于其他算法,而在时间效能上也处于较好水平。