摘要

针对包含印刷体汉字的文字图像提出一种过滤模型,该模型把图像中每一个文字看成一个对象,通过相关技术手段从图像中分割出对象并对这些对象进行识别,将敏感词汇组成部分的对象标记为敏感对象。同时,建立了语义词典,通过组合将敏感对象组合起来并与词典中的词汇相匹配,从而达到识别敏感词的目的,以此为基础可以实现对含有敏感词的图像的过滤。

全文