Bases de données graph : Amazon Neptune disponible chez Amazon Web Services

Les bases de données de graphes sont conçues pour les applications qui doivent travailler sur des associations entre différents groupes de données. AWS propose donc désormais six bases de données gérées sur son service cloud.

Présentée l’an passé à l’événement re:Invent 2017, voici donc que AWS lance en production sa nouvelle base de données graph, nommée Amazon Neptune. De quoi compléter l’offre de bases de données en mode cloud d’AWS, mais aussi se positionner en concurrent direct d’outils existants tels que JanusGraph ou Neo4j. De son côté Azure Cosmos DB de Microsoft propose également des fonctionnalités de base de données de graphes.

Exemple de base de données graph.

Les bases de données de graphes sont conçues pour les applications qui doivent travailler sur des associations entre différents groupes de données. Elles permettent aux utilisateurs de stocker des bouts de données connexes sous la forme d’un graphique auquel il est possible d’accéder en une seule opération. De quoi économiser le nombre de requêtes pour obtenir de la donnée.

Les bases de données Graph, qui utilisent des structures graphiques pour répondre à des requêtes, sont devenues une évidence pour beaucoup depuis que les réseaux sociaux comme Facebook et Twitter en ont fait le cœur de leur gestion de base de données. Twitter a créé FlockDB pour gérer des réseaux Graph larges, et peu profonds. Le projet Cayley de Google s’est directement inspiré de la base de données Graph qui propulse son Knowledge Graph, la base de connaissances reliée à son moteur de recherche. Facebook utilise de son côté Apache Giraph, construit pour assurer une grande évolutivité.

Prise en charge de Property Graph et RDF, via Apache TinkerPop Gremlin et SPARQL

Ce type de base de données est très utilisée par les entreprises qui réalisent des réseaux sociaux, ou encore des applications de détection de fraude.

« Au cœur de Neptune se trouve un moteur de base de données graphique hautes performances spécialement conçu pour stocker des milliards de relations et interroger le graphique avec des latences millisecondes. Neptune prend en charge deux modèles de graphe populaires, Property Graph et RDF, via Apache TinkerPop Gremlin et SPARQL, ce qui vous permet de créer facilement des requêtes qui naviguent efficacement dans des ensembles de données hautement connectés » mentionne AWS.

Pour l’heure, Amazon Neptune réplique six copies des jeux de données qui lui sont confiés dans trois zones de disponibilité. Le service est disponible dans les régions suivantes : Est des États-Unis (Virginie du Nord), Est des États-Unis (Ohio), Ouest des États-Unis (Oregon) et Union européenne (Irlande). D’autres zones devraient être disponible plus tard cette année.

AWS propose donc désormais six bases de données gérées sur son service cloud, ainsi qu’un service de migration de base de données pour le transfert de bases de données hébergées dans le cloud.