针对铁路车站信号平面布置图因数据格式不同而导致其数据无法二次利用的问题,提出基于数据挖掘的车站信号平面布置图信息提取方法。文章构建铁路信号工程图例模型与编码,基于RVDBSCAN算法,将图形数据聚类为图形组;通过C4.5决策树构建模型,以识别铁路信号图例。试验结果表明,聚类方法 FMI评分0.986 0,分类算法准确率95.64%,能够准确识别布置图中的图例符号数据,为布置图信息的二次利用提供了数据通用接口。