摘要
针对在自然场景中文本定位需要大量样本训练导致算法运行速度较慢且倾斜文本难以定位的问题,提出了一种基于最大稳定极值区域(maximally stable extremal regions,MSER)结合层次聚类的快速自然场景倾斜文本定位算法。利用MSER椭圆拟合的方法对图片进行最大极值稳定区域的选取,并根据拟合椭圆的自身特征和在图像上的位置特征,过滤掉大部分的非文本区域,筛选出文本候选区域。运用层次聚类的思想,快速对文本区域逐层聚类融合,最终将单个的文本区域合并成单词区域,实现高效的倾斜场景文本定位。实验结果表明,与传统的定位算法相比,该算法在没有损失定位精度的情况下运算速度有明显的提升。
-
单位哈尔滨理工大学; 电子工程学院