摘要

恶意URL背后往往隐藏着木马程序、诈骗信息、恶意软件,严重威胁到网络安全环境。文章提出了一种基于多分组注意力机制的Bi LSTM-N-Attention模型,将URL作为文本数据分类的问题处理。模型首先将URL作为文本类的时间序列进行输入,通过词嵌入技术映射到稠密向量空间,并利用基于双向的长短时记忆模型(Bi LSTM)进行文本数据的信息提取;然后通过引入多分组Attention机制,提取到时序信息各时刻的相关程度;最后将融合的特征进行二分类预测。实验结果验证了Bi LSTM-N-Attention模型方法的有效性。