摘要

随着互联网、大数据、人工智能和计算机存储等技术和硬件的持续爆炸式发展,档案资源数字化和管理智能化工作也得到了快速的推动。旨在探讨如何推动档案电子化进程和解决档案电子化的困境,以便更好地满足数字化时代的需求。为此,首先,概述了过往的文本内容识别和感知中的相关技术。其次,介绍了电子档案管理应用中所面临的表格内容电子化还原识别难题。然后提出了基于U2-Net深度学习模型的表格格式提取技术,并通过融合CRNN的文字识别技术,实现了端到端的纸质表格内容的全流程解析。最后,强调了文本内容纸质档案中表格内容电子化技术的重要性,并对后续档案管理工作进行了分析和展望。

全文