深度卷积网络的自然场景文本检测研究综述

作者:宋传鸣; 王一琦; 武惠娟; 何熠辉; 洪飏*; 王相海
来源:小型微型计算机系统, 2023, 44(09): 1996-2008.
DOI:10.20009/j.cnki.21-1106/TP.2023-0015

摘要

自然场景文本检测是从场景图像中获取文本信息的重要手段,但是仍旧面临背景复杂、文字种类丰富、排列方向多样、文本行组成复杂等因素的严峻挑战.研究检测精度高、通用性强、稳健性好的自然场景文本检测方法是目前计算机视觉领域的热点问题之一.并且,基于深度卷积网络的自然场景文本检测方法逐渐成为主流.因此,从自然场景文本检测技术的研究背景及主要挑战切入,根据骨干网络的不同将现有方法划分为基于VGG网络的文本检测方法、基于残差网络的文本检测方法和基于特征金字塔网络的文本检测方法,重点阐述各类方法的核心思想、技术优势及其不足;然后,总结自然场景文本检测的公共数据集,对代表性方法的检测性能进行客观比较;最后,梳理和总结自然场景文本检测技术的难点并展望其未来发展趋势.

全文