摘要
针对古籍汉字结构复杂、风格多变以及字形图像降质所导致传统文字图像检索技术在应用于古籍汉字图像时性能不佳的问题,引入犹豫模糊集理论,提出了一种古籍汉字图像检索模型.首先,设计面向古籍汉字图像的重叠模糊规范化双弹性网格划分,通过考察当前网格与其近邻网格间各种字形要素间的几何和统计特征,定义相应的犹豫模糊元素,进而构成古籍汉字查询图像和目标图像的犹豫模糊集合;其次,以犹豫模糊集合的加权距离测度作为古籍汉字查询图像和目标图像的相似性测度,得到古籍汉字图像检索结果的有序输出.本文算法在11 574幅古籍汉字图像上的检索查准率和查全率分别为78.9%和76.5%.
-
单位河北大学; 河北大学附属医院