摘要
网络诈骗呈现规模日增、形式多样、手段高超的特点,由于其不存在实体,钓鱼者往往通过互联网窃取公民信息用以牟利,受害者因缺少获取相关电子数据的手段,且无法及时联系所属侦查机关导致其难以维权,给其带来巨大损失。针对上述问题,提出了基于机器学习的钓鱼网站检测和取证模型,主要依靠URL过滤模块对网站URL的特征进行抽取与分析来实现前期过滤,后期分别采用随机森林和逻辑回归模型来做对比实验,结果显示随机森林分类器对钓鱼网站的识别效果更好,最后利用Puppeteer实现网页的相关取证功能。实验证明所提出的钓鱼网站检测与取证模型可以有效识别钓鱼网站,保护用户免于钓鱼网站诈骗,同时也能为公安机关提供相关电子证据。
- 单位