摘要

为响应国家“净网行动”,本实验针对蕴涵文本信息的图片广告难以审核问题,提出一种基于人脸识别和OCR文字识别的图文结合的审核技术,通过构建敏感人物的人脸图片库和敏感人物人名库进行对比审核。本实验采用基于c++编写的Dlib库face_recognition,利用其底层的残差网络(ResNet)学习图像特征,对于疑似包含敏感人物的广告图片先进行人脸目标检测,然后利用锁定的人脸图像块抽取人脸特征,然后和构建的敏感人物人脸图片库进行对比,识别出是否含有敏感人物;同时利用OCR技术从图片中识别提取文本信息,利用基于前缀树字典和AC自动机算法的flashtext关键词匹配算法,根据构建的敏感人名库进行规则匹配审核,达到基于图文结合的人物敏感广告图片识别的效果。

全文