摘要
如今重要的数据大都通过表格直接展示,在分析数据时,除数据和文字信息外,表格结构信息也很重要,要想更加准确、便捷地分析表格数据,能否自动准确地识别表格结构至关重要。现在有很多识别表格结构的方法,对表格单元格检测的准确率也都比较理想,但是很少有方法在特征提取方面做出改进。为了证明图像特征提取在表格结构识别过程中的重要性,针对这一问题在TGRNet的基础上引入了多频谱注意力机制,以便更好地提取图像多个频谱上的特征,使得到的特征更加全面。在公开数据集上的实验结果显示,所做改进较原方法在表格结构识别的单元格空间位置和逻辑位置检测的准确率有所提升。
- 单位