摘要

针对一般网页篡改检测技术无法同时作用于静态网页和动态网页,且通常是通过对源代码进行处理或者嵌入水印的方式来达到检测的目的,过程繁琐准确性不够。论文通过设计网页抓取模型以及图像处理模型来区分前后两张网页图片的异同,从而达到检测网页是否被篡改的目的。网页抓取模型主要是模拟浏览器的行为来编译网页代码,获取界面图像并建成图像库。图像处理模型是利用图像处理中两种特征点检测的方式获取图像中的特征点信息,并利用欧氏距离来匹配获取的特征点信息,通过比较两个特征点信息集合的欧氏距离来判定前后两个网页的相似度,从而起到检测网页是否被篡改的作用。