摘要

【目的】调研国内外使用深度学习技术抽取科技文献知识单元的相关研究成果。【文献范围】以“知识单元”“深度学习”等为关键词在Web of Science、Google Scholar和CNKI等数据库进行文献检索,人工整理筛选得到71篇具有代表性的文献进行综述。【方法】梳理科技文献知识单元的相关概念并总结科技文献知识单元的特点,从科技文献知识单元特点出发,归纳基于深度学习技术的科技文献知识单元抽取的研究成果。【结果】目前使用的抽取方法,在本质上都是基于词粒度知识单元或句粒度知识单元。科技文献知识单元抽取过程中的深度学习过程实际上是对词粒度知识单元和句粒度知识单元所具有的不同特点进行学习和捕获,这也是使用深度学习方法抽取科技文献知识单元的关键。【局限】以筛选得到的样本文献为基础进行综述,未能全面反映本领域的成果。【结论】深度学习技术在知识单元抽取中的应用提高了抽取的准确性、覆盖性和鲁棒性,未来的相关研究不仅要考虑科技文献的文本结构化信息,更需要理解其内部知识内容和内在逻辑。