摘要
基于部件的树结构模型(TSM)使用的底层特征梯度直方图(HOG)对文字特征表达性不强,且降维时易造成信息丢失。针对该问题,构建以稀疏编码直方图(HSC)为底层特征的基于部件的树结构模型(HSC-TSM)识别场景文本。将K-SVD学习字典用于计算稀疏编码,逐像素地将稀疏编码聚合成HSC,描述文字的局部外观信息;通过奇异值分解对HSC进行降维,避免信息丢失。HSC-TSM在数据集ICDAR 2003上对各类文字的识别率比TSM高3.08%-10.28%,在数据集ICDAR 2003和SVT上的单词识别率分别提升了5.30%和3.62%。