摘要

现代农业书籍里文字、图片、表格等多种格式的信息贯穿其中,这使得采用图像进行文字识别时信息提取不准确,文字识别率不高,影响了农业信息的采集。文章针对农业书籍信息采集中的难点问题进行研究,将图像处理、视觉识别、版面提取等技术进行有效整合,重点研究基于卷积神经网络的复杂版面与文字符号的识别、采用Leaky ReLU激活函数、搭建GoogLeNet训练网络进行样本训练,进一步提高文档识别的准确率。