基于音节切分的藏文印刷体识别

作者:才让当知; 华却才让*; 黄鹤鸣
来源:计算机工程与设计, 2022, 43(09): 2594-2600.
DOI:10.16208/j.issn1000-7024.2022.09.025

摘要

为解决藏文印刷体标注数据库资源稀少和藏文图像文本分割难度大等问题,提出一种基于音节切分的藏文体印刷体识别方法。以字符面积最小为依据,找到音节分隔符;合并音节分隔符之间的字丁,构成音节;按音节位置进行分割,经实验分割准确率提升3.92个百分点。为验证选择音节的有效性,在同一结构的LetNet-5网络模型上进行测试,实验结果表明,以音节为单元时识别性能更优,其平均识别正确率达96.11%。

全文