基于Transfer-crf神经网络的电子表格智能识别算法

作者:毛尚伟; ***; 汤槟; 郑成坤; 翟波; 符云清
来源:重庆理工大学学报:自然科学, 2019, 33(10): 155-160.

摘要

电子表格是一种使用非常广泛的数据存储和分析工具,但其数据结构形式多样、结构复杂。为了快速准确地识别电子表格结构,提出了基于深度学习序列标注模型的电子表格结构自动识别方法。首先,确定待识别的电子表格数据结构;其次,采用中国国家统计局数据对模型进行训练;最后,将本文提出的算法与基于条件随机场序列标注的电子表格结构识别方法进行实验对比。实验结果表明:提出的算法在多个评估指标上都取得了较好的结果。