摘要

电网大数据的数据结构复杂、种类繁多,除传统的结构化数据外,还包含大量的半结构化、非结构化数据,如服务系统的语音数据,检测数据中的波形数据、直升机巡检中拍摄的图像数据和地理信息数据等。针对电力大数据的复杂性和地理图数据在服务匹配查询中困难的问题,提出一种基于描述逻辑的匹配模型,该模型的描述逻辑包括TBox和ABox,其方法是将个体和整体分开进行量化。在匹配用户输入本体数据库时,该模型采取正式化信息域作为类和实例,同时基于RDF框架的描述逻辑将结构化数据转换为DL。该模型通过Hadoop组件生成SPARQL查询语言,然后查询语言与Mongodb匹配输出查询处理结果。最后基于实际数据进行大量对比实验,结果证明了该模型提供了最小的搜索时间和最佳的匹配准确度。