摘要
为了提升大数据背景下数字图书信息的检索效率,文中对图书信息的检索业务流程进行了梳理,并针对信息标注时准确率低的问题展开了研究。通过引入图像、文本和用户三个维度的相似度,寻找待标注信息和数据库已有信息的关联性,使得新的图书信息可以快速写入现有数据库。此外,为解决该方法在现有数据库中无相似信息时识别率低的问题,采用了RCNN深度学习网络先将信息划分为主体区域和多个次要区域,再通过不同结构的深度学习网络对不同区域进行特征提取,在提升算法训练效率的同时,也提升了特征提取的准确率。基于某数字馆藏图书信息数据集进行的仿真验证结果表明,文中引入的相似度指标与标注的准确率呈正相关,算法相较于现有的OTC、Mop-CNN、ImageNet-CNN等人工智能网络,准确率分别提升了0.372、0.093和0.201。