暗网因具有匿名、匿踪等特点,已然成为不法分子的聚集地。近年来,暗网中各种数据泄露事件频出,而这些事件大多来源于市场和论坛。因此,准确识别暗网市场、论坛等重要站点,对于暗网情报的快速获取意义重大,并为进一步监控暗网动态奠定了基础。因此,设计实现了一套暗网空间资源采集系统,用于收集暗网页面资源,并结合验证码/登录页面检测和页面文本特征检测两种方式识别暗网重要站点。实验证明,该检测方法具有良好的分类性能,平均准确率可达96.47%。