摘要

随着计算机技术的发展,光学识别技术的发展已较为成熟,但自然场景图像包含较复杂背景,字符的提取和识别技术难度相对较大。在自然场景中文本区域提取技术的基础上,提出了一种字符提取模型,详细介绍了基于局部重叠阈值的图像二值化算法,通过字符的水平、垂直投影技术,实现了单个字符边界的划分,并根据字符的某些特征对非字符进行了过滤,最终实现了字符的提取。