摘要

随着互联网和移动互联网技术的发展,人工智能、大数据、云计算、机器学习的循序渐进的研究和具体应用,也催生出了文字识别和文字翻译的新应用。本文着重分析图像截取、文字识别和文字翻译应用结合研究的现状以及应用前景,并对现有的文字识别算法做简要概述和Tesseract ORC算法做具体分析。图像截取、文字识别和文字翻译应用结合的功能将成为新一代的办公软件和社交软件的基本功能,新的用户体验也必将推动着办公软件和社交软件的革新。本文提出,图像截取、文字识别和文字翻译三种应用结合的基本模型结构,并对该模型结构结合现有的机器学习算法做示例实现,过示例演示对模型结构做具体解释。