摘要
二值化处理是文档图像OCR识别中非常重要的一个环节。针对目前主流Sauvola二值化算法存在参数需要人为确定、效果受设定的参数影响等问题,提出了基于Sauvola算法和神经网络的图像自适应二值化方法。在针对Sauvola算法的参数进行分析的基础上,阐述了开窗大小r与参数k对二值化结果的影响。使用SWT算法实现了开窗大小r的计算,将二值化视为对像素点的二分类问题,根据Sauvola算法的思想提取窗内的灰度均值、灰度标准差及当前像素点灰度值作为特征向量,并搭建全连接神经网络进行训练,训练后的神经网络可为每个窗生成特定的参数k,并判定各个像素点的二值化结果。实验结果表明,相较于使用人工精确调节的全局参数k的Sauvola算法,所提出的方法具有更好的自适应性和二值化效果,且具有较好的实用性和普适性。
- 单位