为了更准确快捷的对钓鱼网站进行识别,提出了一种基于改进随机森林算法的钓鱼网站检测方法.该方法挖掘钓鱼网页特征之间潜在的关联规则,并对数据集进行分区,以此区分特征数据的重要程度并计算权重以及数据选取的比例,选取数据后对数据空间进行相应的集合化与剪辑以此优化森林的建立,并根据建立的森林达到对钓鱼网站检测识别的目的.最终实验说明,该方法对钓鱼网站的检测识别具有很好的效果和效率.