摘要
维吾尔文文字具有粘连性大、结构不封闭等特点,这给维吾尔文关键词图像检索造成了极大的困难.为提高维吾尔文文档图像检索效率,提出一种基于灰度直方图与改进Hu不变矩的关键词图像二次检索算法,该算法对单词图像进行两次检索:粗略检索和二次检索.在粗略检索阶段,对切分后的单词图像提取灰度直方图特征并对单词数据库进行粗略匹配,在保证召回率的情况下,过滤掉部分无关单词图像形成候选单词库.在粗略匹配的基础上进行精确匹配,使用改进的Hu不变矩对关键词图像的轮廓特征进行描述,该方法在Hu不变矩中将离心率、区域矩和结构矩统一,可以有效地描述图像的轮廓信息.在包含115张纯文本维吾尔文文档图像数据库上进行实验,其检索准确率平均值为78.36%,召回率平均值为81.68%.
- 单位