摘要
自然场景下的文本检测分为提取候选区域和滤除非文本两个阶段.在候选区域提取阶段,针对最大稳定极值区域(Maximally Stable Extremal Regions,MSER)算法对噪声、模糊敏感,检测性能不高的问题,提出改进的MSER算法,首先通过梯度图增强图像字符边缘,然后采用MSER算法提取文本区域,最后利用多机制抑制策略进行粗过滤.在非文本滤除阶段,针对候选域中非文本区域过滤不彻底的问题,提出基于SVM的多特征自适应权值融合的非文本滤除算法,首先对标识样本库提取HOG、统一化LBP、颜色感知差异(Color Perception Difference,CPD)特征,使用提出的权值计算公式自适应分配权重融合三种特征,然后采用粒子群算法寻找SVM最优参数训练分类器,最后将候选区域送入训练好的分类器滤除非文本.实验结果表明,改进的文本检测算法能够达到理想的检测效果.
-
单位重庆邮电大学; 通信与信息工程学院