摘要
主要介绍了一种借助于OpenCV (开源计算机视觉库)、Tesseract-OCR (Google的开源光学字符识别引擎),以及用Python语言对Tesseract-OCR引擎的相关接口封装的Pytesseract模块,实现图像上的字符识别。使用OpenCV对图像进行一系列预处理,如读取、色彩空间转换、图像的降噪以及图像阈值化处理等操作后,使用Pytesseract模块将处理后的图像传入Tesseract-OCR中,实现了较准确的英文字符识别。
-
单位大连外国语大学