摘要

汉字识别是模式识别的一个重要分支,在汉字智能处理和自动录入方面具有广泛的应用前景。随着深度学习技术的快速发展,汉字识别取得了突破性的进展。然而样本库的样本数量是制约汉字识别效果的一个关键因素,单通过扫描、拍照等传统手段获取样本,效率十分低下。针对印刷体汉字样本库缺乏的问题,采用基于块的图像风格迁移算法将汉字原图扩增为具有真实感光效果的汉字风格图,然后再经过薄板样条变形(Thin plate spline,简称TPS)将风格图变成最终的汉字样本图片。从风格迁移和TPS变形的效果图来看,该算法在一定程度上解决了样本库缺乏的问题。与其他文献中利用余弦整形变换或弹性变换的扩充样本库算法相比,使用薄板样条变形可以获取更加丰富的样本库,而基于风格迁移生成具有真实感光效果的汉字样本图片是一种比较新颖的扩充汉字样本库的思路。