文章目录
由于RDF是W3C推荐的表示语义网上关联数据(LinkedData)的标准格式,RDF也是表示和发布Web上知识图谱的最主要数据格式之一面向RDF的三元组数据库是专门为存储大规模RDF数据而开发的知识图普数据库,其支持RDF的标准查询语言SPARQL。主要的开源RDF三元组数据库包括:Apache旗下的Jena、Eclipse旗下的RDF4J以及源自学术界的RDF-3X和gStore;主要的商业RDF三元组数据库包括:Virtuoso、AllegroGraph、GraphDB和BlazeGraphApacheJena将以实践形式进行详细介绍;下面分别介绍RDF4J、RDF-3X、gStore、Virtuoso、AllegroGraph、GraphDB和BlazeGraphd
开源RDF三元组数据库RDF4J
RDF4J目前是Eclipse基金会旗下的开源孵化项目,其前身是荷兰软件公司Aduna开发的Sesame框架。Sesame框架的历史可以追到1999年,当时作为Aduna公司的一个语义Web项目进行开发,后来发展成为语义Web领域一个非常有名的管理和处理RDF的开源Java框架,功能包括RDF数据的解析、存储、推理和查询等。2016年5月,Sesame框架改名为RDF4J,并迁移为Eclipse开源项目继续开发RDF4J本身提供内存和磁盘两种RDF存储机制,支持全部的SPARQL1.1查询和更新语言,可以使用与访问本地RDF库相同的API访问远程RDF库,支持所有主流RDF数据格式,包括RDFXML、Turtle、N-Triples、N-Quads、JSON-LD、TriG和TriX
RDF4J框架的重要特点是其模块化的软件架构设计。下图给出了RDF4J的高层架构图,其设计采取典型的层次结构,