针对PDF文件进行表格抽取研究是获取期刊文献中的表格数据并实现数据管理和共享的基础。通过分析近二十多年的有关PDF表格抽取技术的学术文献,总结出PDF表格抽取的三种思路。从算法构建的特征的角度对主要的表格抽取算法进行分类,并分析算法各自的特点和优劣;介绍表格抽取算法性能评估的研究现状,在此基础上总结和提出未来表格抽取技术的研究和发展方向。