摘要
古籍图像文字检测是识别的基础,利用信息技术手段实现古籍图像单个文字检测,对于古籍文字识别具有重要意义。本研究以南京图书馆藏古籍文献作为样本展开实践,首先,对古籍文献数据进行图像采集,将采集到的数据进行人工标注;然后,提出基于Faster-RCNN算法进行优化,并构建数据集进行训练;最后,通过Vgg16和ResNet101骨干网络对比,发现更深层次的ResNet101骨干网络结构能够提升文字检测精度,样本检测精确率为99.74%,召回率为96.80%,f值为98.25%。实验表明,基于Faster-RCNN算法能实现古籍图像文字有效检测。