摘要

针对多重文档识别时出现的识别效率慢与识别精准度低的问题,文中提出了一种基于深度学习的多重文档结构识别方法。利用自编码器构建多层文档学习网络,调整训练的参数,使用卷积神经网络内的多层神经网络对多重文档进行特征提取、特征学习与次抽样。估算现实输出和对应期望输出的差值,提高文档结构识别精度。利用多元函数对文档结构解析,完成多重文档结构识别。实验证明,该方法比传统方法能够更快速地识别多重文档结构,并且识别精准度较高。