Gurumukhi印刷报纸的文字识别(英文)

作者:Rupinder Pal Kaur; Manish Kumar Jindal; Munish Kumar*
来源:Journal of Central South University (English Edition), 2019, 26(09): 2495-2503.

摘要

本文提出了一种基于Gurumukhi字体的报纸识别系统。采用分区特征、对角线特征、抛物线拟合特征和势曲线拟合特征提取技术对报刊印刷字符的统计特性进行提取。为了提高识别精度,还对这些特征进行了不同的组合。在识别方面,采用了k-神经网络、线性支持向量机、决策树和随机森林四种分类技术。实验数据库是从三家主要的Gurumukhi字体报纸Ajit, Jagbani和Punjabi Tribune收集的。采用五倍交叉验证和随机森林分类器,以及分区特征、对角线特征和抛物线拟合特征相结合的方法,识别准确率达96.19%。采用数据集分割策略(70%的数据作为训练数据,其余的30%的数据作为测试数据),识别准确率达到95.21%。