摘要
当前,大数据可靠性研究已经成为各行业值得关注的问题之一。本文提出一个Hadoop框架来对高校美术绘画资源(RDF三元组)进行存储及检索管理,描述了在HDFS(Hadoop Distribute File System)中存储RDF数据的模式,同时还提供了专门的SPARQL检索算法对RDF文件进行查询。本文利用Hadoop的MapReduce框架来实际解决查询问题,结果表明,可以在Hadoop集群中存储大量语义Web数据,这些集群主要由廉价的商品级硬件构建,并且仍然可以足够快地响应查询需求。并证明该框架是一个可扩展的框架,能够有效地处理大量的RDF数据
- 单位