基于LSTM的钓鱼邮件检测系统

作者:张鹏; 孙博文; 李唯实*; 徐君锋; 孙岩炜
来源:北京理工大学学报, 2020, 40(12): 1289-1294.
DOI:10.15918/j.tbit1001-0645.2019.262

摘要

提出了一种基于LSTM的钓鱼邮件检测方式.该方式主要由两部分构成:分别为数据扩充部分及模型训练部分.数据扩展部分中,通过KNN与K-means算法扩大训练数据集,保证数据的数量能够满足深度学习算法的需要.在模型训练部分中,通过对数据进行预处理并将其转化为词向量矩阵,最后将转化完词向量通过训练得到LSTM神经网络模型.最终,可以根据训练好的LSTM模型将邮件分为正常邮件以及钓鱼邮件.通过实验对提出的算法进行了评估,实验结果显示提出的算法准确率可以达到95%.