藏文古籍文字识别训练数据的合成方法研究

作者:仁青东主; 头旦才让; 尼玛扎西*
来源:高原科学研究, 2021, 5(03): 84-91.
DOI:10.16249/j.cnki.2096-4617.2021.03.011

摘要

文章针对藏文古籍文字识别训练数据稀缺问题,在藏文古籍木刻本文字识别任务中使用训练数据合成方法,将合成的训练数据融入到实际标注样本中进行训练。实验发现,识别准确率达到了94.96%,相比于实际标注样本训练结果提升了13.96%,一定程度上解决了低资源语言训练语料规模小的问题。

全文