Toutes les données doivent être stockées quelque part, que ce soit la liste des employés d’une entreprise, le menu d’un restaurant ou les mots de passe des utilisateurs d’un site web. Le plus souvent, on utilise des bases de données (BD) à cette fin. Elles existent sous plusieurs types, structurant les informations sur les objets de différentes manières.

En fonction du processus de développement du produit, une entreprise peut créer une BD avec une structure logique appropriée et la gérer efficacement à l’aide de systèmes de gestion de bases de données (SGBD). Dans cet article, nous parlerons des principaux types de bases de données, de leurs caractéristiques et de leurs différences les uns par rapport aux autres.

Pourquoi les bases de données sont-elles nécessaires ?

Les bases de données permettent de :

Trouver rapidement les informations nécessaires au sein d’un grand volume de données.
Obtenir, ajouter et mettre à jour des données avec un minimum d’efforts.
Configurer différents niveaux d’accès. Par exemple, certains employés peuvent être empêchés de consulter les données, tandis que d’autres peuvent être autorisés à les modifier.
Travailler simultanément en équipe. Plusieurs personnes peuvent travailler en même temps dans une base de données.
Stocker de grandes quantités d’informations, ce que d’autres outils ne permettent pas de faire.

Bases de données les plus simples

Les bases de données les plus simples peuvent être créées à l’aide d’éditeurs de texte classiques, sans recourir à un logiciel spécialisé. L’essentiel est que les données aient une structure claire et que le contenu des champs soit facilement distinguable. Ces bases de données conviennent, par exemple, pour des listes d’employés, de numéros de cartes ou de clients faisant partie d’un programme de fidélité. Il s’agit généralement de petites quantités de données.

Fichiers texte Les informations sont stockées dans des formats textuels (txt, csv), où les champs sont séparés par des espaces, des tabulations et des signes de ponctuation tels que des virgules, des points-virgules et des deux-points. Les bases de données les plus simples conviennent lorsque vous avez besoin d’une base de données simple contenant de 50 à 200 enregistrements. Par exemple, un annuaire téléphonique.

Avantages :

Peut être édité avec un éditeur de texte classique.
Pratique pour travailler avec des données de configuration.

Inconvénients :

Difficulté à établir des liens entre les données.
Inadapté aux grandes quantités de données.

Exemples : fichiers etc/passwd et etc/fstab, fichiers csv, fichiers ini, etc.

Bases de données hiérarchiques

Une base de données hiérarchique est un système avec un répertoire racine et une hiérarchie de sous-répertoires et de fichiers. Tous les objets sont divisés en ancêtres et descendants et sont étroitement liés. Chaque enregistrement ne peut avoir qu’un seul ancêtre, ce qui donne à la base de données une structure en arborescence. Les bases de données hiérarchiques conviennent, par exemple, pour créer la structure organisationnelle d’une entreprise.

Avantages :

Le chemin vers un objet est construit à partir des noms de répertoires racine et des sous-répertoires.
Il permet de modéliser des relations de subordination.

Inconvénients :

Le système de stockage des données est limité.

Exemples : systèmes de fichiers, DNS et LDAP.

Bases de données réseau

Les bases de données réseau sont similaires aux bases de données hiérarchiques, mais elles peuvent avoir plusieurs parents. Cela permet de modéliser des relations complexes entre les objets. C’est ainsi que sont organisées d’énormes quantités d’informations sur Internet, où les hyperliens relient des millions de documents entre eux.

Exemple : IDMS.

Bases de données relationnelles

Dans les bases de données relationnelles, les données sont organisées en tables et ont une structure rigide, où les lignes sont des valeurs de propriétés et les colonnes sont des propriétés d’objets. Ce type est souvent utilisé au début du développement d’applications et de services. Par exemple, pour créer un menu pour un nouveau restaurant ou une base de données de bibliothèque où il est important de répartir les objets en différentes catégories.

Avantages :

Affichage pratique des données sous forme de lignes et de colonnes.
Utilisation de la fonctionnalité du langage de requête SQL.
Possibilité de mise à l’échelle horizontale et verticale des données.
Les relations complexes permettent de construire des bases de données graphiques, tandis que les bases de données relationnelles permettent uniquement des relations parent-enfant primitives.

Inconvénients :

Faible performance en raison de relations complexes entre les données.
Structure rigide des tables relationnelles, qui n’autorise pas les programmeurs à écrire des ensembles arbitraires d’attributs dans leurs objets.

Exemples : Oracle, Microsoft SQL Server, MySQL, PostgreSQL, SQLite.

NoSQL et bases de données non relationnelles

Dans les bases de données relationnelles, il est difficile de stocker et de traiter des données mal structurées ou non structurées. Pour résoudre ces problèmes, il existe un type distinct de bases de données : les bases de données non relationnelles.

Bases de données clé-valeur Les données sont stockées sous forme de tableaux avec des clés et des valeurs spécifiques. Les bases de données clé-valeur sont souvent utilisées en conjonction avec d’autres bases de données en tant que mécanisme de mise en cache.

Avantages :

Convient à différents types de données (fichiers, texte, nombres) sous différentes clés.
Accès rapide aux données grâce au stockage adressable.
Règles de partitionnement basées sur des clés spécifiques.

Inconvénients :

Manque de fonctionnalités standard des bases de données telles que l’atomicité des transactions et la cohérence des données en cas d’exécution simultanée de plusieurs transactions.
Difficulté à maintenir des clés uniques avec l’augmentation du volume de données.

Exemples : Amazon DynamoDB, Redis, Riak, LevelDB, Memcached, etc.

Bases de données orientées document

Les données sont stockées sous forme de documents JSON regroupés dans des collections formant des systèmes de bases de données. Le contenu d’un document peut avoir un ensemble varié de propriétés et de caractéristiques. C’est pourquoi de telles bases de données sont utilisées pour créer des catalogues, des livres, des blogs et des plates-formes de streaming vidéo, entre autres.

Avantages :

Convient au développement de services travaillant avec des données structurées de différentes manières.
Facilité de mise à l’échelle et de modification de la structure.
Création rapide de documents et maintenance minimale.
Absence de clés externes, ce qui rend tous les documents indépendants les uns des autres.
Utilisation de formats tels que XML, JSON, et d’autres pour décrire les documents.

Inconvénients :

Limitations en matière de vérification de la cohérence, ce qui peut réduire les performances des bases de données.
Difficulté à extraire des données de plusieurs sources liées.
Risques de fuites de données confidentielles des applications web.

Exemples : MongoDB, RethinkDB, CouchDB, DocumentDB, etc.

Bases de données graphiques

Les bases de données graphiques modélisent les relations entre des objets fortement interconnectés. Elles reposent sur une structure topographique en réseau et sur la théorie mathématique des graphes. Les graphes représentent des ensembles de données sous forme de nœuds, d’arêtes et de propriétés. Ces bases de données sont utiles pour recommander en temps réel des ressources aux utilisateurs et améliorer leur expérience. Par exemple, les services musicaux proposent des playlists personnalisées, et les places de marché recommandent des listes de produits basées sur les choix des utilisateurs.

Avantages :

Hautes performances et structure adaptable.
Relations claires entre les entités.
Résultats en temps réel.

Inconvénients :

Absence de langage de requête standardisé.
Inadapté aux systèmes basés sur des transactions.

Exemples : Neo4J, JanusGraph, Dgraph, OrientDB, etc.

Bases de données colonnes

Dans les bases de données colonnes, les données ne sont pas stockées dans des tables, mais dans des colonnes. Les clés pointent vers le format des lignes qui contiennent les informations sur les objets. Chaque ligne a son propre ensemble de propriétés, ce qui permet de stocker des données structurées de manière variable dans le cadre d’une même famille de données. Les bases de données colonnes sont utilisées pour l’analyse de gros volumes de données, par exemple, pour filtrer et trier les produits dans un magasin en ligne ou pour obtenir des statistiques de site par jour, catégorie, prix, etc.

Avantages :

Possibilité de faire des requêtes complexes sur de grandes tables.
Modification instantanée de la structure de grandes tables.
Exécution rapide des requêtes.
Évolutivité et adaptabilité de la structure.

Inconvénients :

Performances lentes en écriture.
Pas de prise en charge des transactions.
Contraintes pour les développeurs.

Exemples : Cassandra, HBase, ClickHouse, etc.

Bases de données de séries temporelles

Les séries temporelles englobent tout ce qui peut être mesuré sur des périodes de temps telles que des heures, des jours, des mois ou des années, etc. Les métriques peuvent varier, comme le trafic routier, le niveau de l’eau dans une rivière, la charge sur un serveur, et bien d’autres. Les données peuvent être interrogées, analysées et des dépendances peuvent être identifiées entre différentes métriques. Les performances de la base de données dépendent de divers facteurs : le volume d’informations, le nombre de requêtes et les métriques elles-mêmes.

Exemples : OpenTSDB, Prometheus, InfluxDB, TimescaleDB, etc.

Types de bases de données combinés

Les types de bases de données combinés fusionnent les approches SQL et NoSQL, y compris les solutions NewSQL et multidimensionnelles.

Bases de données NewSQL Ce type de base de données représente une solution compromise et relativement récente. Les bases de données NewSQL conviennent le mieux aux secteurs où la gestion de données critiques est essentielle, tels que les finances, la banque, les soins de santé, et d’autres. Elles offrent aux entreprises soucieuses de la mise à l’échelle et de la fiabilité lors de l’exécution de transactions plusieurs avantages :

Avantages :

Facilité de mise à l’échelle.
Haute performance et disponibilité des données.

Inconvénients :

Exigences élevées en termes de ressources matérielles.

Exemples : MemSQL, VoltDB, Spanner, et d’autres.

Bases de données multidimensionnelles

Les bases de données multidimensionnelles combinent plusieurs approches d’organisation des données dans un seul système de serveur, ce qui permet de stocker, de requêter et d’indexer des données à partir de différents modèles. Elles peuvent transformer l’information d’un format à un autre et sont souvent utilisées pour la gestion des systèmes informatiques, la centralisation des données, et l’analyse de grands volumes de données.

Avantages :

Cohérence des données entre les modèles.
Résilience en raison de la conformité ACID.
Intégration aisée de nouveaux modèles de bases de données dans le système.
Convient aux projets complexes.

Inconvénients :

Complexité des bases de données multidimensionnelles.
Le modèle multidimensionnel est encore en développement et n’a pas de structure finalisée.
Disponibilité limitée de différentes méthodes de modélisation.
Non adapté aux projets ou systèmes simples.

Exemple : ArangoDB.

Lors du choix d’une base de données, il est important de prendre en compte les facteurs suivants :

Le type et la complexité des données à stocker.
Les relations entre les données.
Les performances des opérations de lecture, d’écriture et de modification de la structure de la base de données.
L’expérience de l’équipe de développement.
La phase du cycle de vie du produit en cours de développement.
Le volume prévu des données.
Les types de requêtes qui seront effectuées sur la base de données.

Les entreprises peuvent gérer leurs propres bases de données, mais cela peut nécessiter des ressources importantes en termes de temps, d’argent et de personnel. Des économies de ressources sont possibles en déléguant la gestion des bases de données à des fournisseurs de services cloud.

Bases de données : types et caractéristiques

Pourquoi les bases de données sont-elles nécessaires ?

Bases de données les plus simples

Bases de données hiérarchiques

Bases de données réseau

Bases de données relationnelles

NoSQL et bases de données non relationnelles

Bases de données orientées document

Bases de données graphiques

Bases de données colonnes

Bases de données de séries temporelles

Types de bases de données combinés

Bases de données multidimensionnelles