摘要

物体检测是计算机视觉领域的一个关键内容,主要研究如何在静态图像或动态视频流中快速、准确地识别及定位出其中的目标。基于图像的古建筑检测可用于古建筑三维重建、智慧旅游等领域,具有重要的研究意义和实际应用价值。然而,受到古建筑样式、形状、花纹及纹理质地等影响,目前的物体检测器存在检测精度低和定位不准的问题。针对上述问题,基于YOLOv3网络模型,结合密度聚类和距离聚类思想,设计了一种基于RNN-DBSCAN+k-means的古建筑检测方法。该方法首先结合影响空间思想,采用RNN-DBSCAN算法对已标注的古建筑图像聚类,生成聚类结果集;其次从聚类结果集中选取最优的k个结果作为k-means的初始聚类中心;然后将这k个聚类中心作为聚类初始值,结合k-means算法得出聚类结果,并作为YOLOv3网络的先验框;最后以voc数据集(20类)和古建筑数据集为对象,验证了算法的有效性。针对古建筑数据集,算法检出率提高了0.33%;而在voc数据集单类检测中,算法检出率提高了0.04%~0.84%。