摘要
自然场景文本检测技术已经成为计算机视觉领域重要的研究任务,在图像检索、辅助驾驶、工业检测等领域具有广泛应用。在现有的基于深度学习的自然场景文本检测方法中,非极大抑制算法在对同一个真实文本框的重复检测进行合并和筛选时,将预测框的分类置信度作为排序依据,导致那些定位更精确而分类置信度略低的预测框被抑制,从而影响检测准确率。为了提高预测框的定位精确度,文中提出基于置信度融合的文本检测方法。首先,设计了交并比网络,作为每个预测框的定位置信度;其次,在非极大抑制算法中,将定位置信度与文本分类置信度融合作为预测框排序的依据;最后,在ICDAR2011和ICDAR2013数据集上对该方法进行了实验,结果表明,该方法检测的文本框更加紧致,包含的背景区域更少,可以提高文本检测的准确率。
- 单位