Go to Top

Focus sur le RAID

Focus sur le RAID

Le RAID, ou Redundant Array of Independent Disks (pour regroupement redondant de disques peu onéreux) est une méthode de stockage de données dans laquelle vous pouvez distribuer ou diffuser des données sur plusieurs disques, dans le but d’accroître les performances et la fiabilité.

Il n’est donc pas surprenant que les organisations et entreprises utilisent les systèmes RAID en raison de leur fiabilité. Ce concept, vieux d’une trentaine d’année, n’est pas réservé aux sociétés. Un particulier travaillant par exemple sur de l’édition vidéo ou de la production de musique peut également utiliser ce système, non seulement pour augmenter les performances et la fiabilité, mais également pour augmenter la capacité de stockage des données.

RAID logiciel vs RAID matériel

RAID logiciel vs RAID matériel

Il existe deux façons de paramétrer votre système RAID. Premièrement, il existe une configuration matérielle qui implique votre ordinateur hôte (ou votre serveur) et un contrôleur RAID. Dans une configuration matérielle, le contrôleur RAID est responsable de tout ce qui concerne le RAID : la lecture et l’écriture des données, ainsi que l’emplacement et le disque où elles sont stockées. Le système d’exploitation hôte n’a aucune connaissance du fait qu’il existe plusieurs lecteurs dans le système RAID, et considère l’ensemble comme une seule unité logique. Dans un réseau RAID logiciel, c’est légèrement différent. Le contrôleur RAID est implémenté dans le système d’exploitation, ce qui provoque une légère diminution des performances, car le système d’exploitation effectue plusieurs opérations simultanément (car il n’y a pas de contrôleur RAID matériel séparé).

Avant d’étudier les différents niveaux de RAID et de comprendre comment ils fonctionnent, nous allons étudier un peu de vocabulaire.

Vocabulaire

Vocabulaire RAID

Tout d’abord, il existe une «parité». La parité est un concept très important du RAID : c’est la manière de distribuer les données sur plusieurs lecteurs afin d’aider à la répartition des charges et à la récupération des données si un problème devait survenir.

Vient ensuite la «redondance», qui signifie en informatique la duplication de composants critiques. Si jamais l’un d’eux rencontre une défaillance, l’ensemble du système ne sera pas touché et continuera de fonctionner. Dans le cas des systèmes RAID, ces composants sont les lecteurs. Nous reviendrons plus en détail là-dessus prochainement.

Les deux autres concepts essentiels dans le RAID sont le mirroring  (ou miroitage) et le striping (ou répartition). Le mirroring, comme son nom l’indique, met en mirroir les données d’un lecteur à l’autre, ce qui réplique exactement les mêmes informations afin qu’elles puissent être récupérées en cas de problème.

Ensuite, nous avons le striping, c’est-à-dire lorsque les données sont écrites séquentiellement sur plusieurs disques. Nous analyserons son fonctionnement dans la partie sur la configuration RAID 0.

Avant de terminer cette partie, il convient de mentionner qu’il existe plusieurs niveaux de RAID différents. Nous en avons choisi quatre pour les besoins de cet article, mais si par exemple vous êtes une entreprise avec des applications ou des bases de données sur mesure, vous pouvez chercher à créer votre propre niveau RAID en fonction de vos besoins. Les niveaux vont de RAID 0 jusqu’à RAID 61 et au-delà, mais il existe également de nombreux autres niveaux imbriqués ou sur mesure. Ceux que nous examinerons ici sont les quatre niveaux les plus basiques.

RAID 0

Configuration RAID 0

Avec une configuration RAID 0, qui utilise le concept de striping, il doit y avoir au moins deux lecteurs. Comme vous pouvez le voir, les données sont « stripées » sur les deux disques, ce qui est fantastique en termes de performances de lecture / écriture par rapport au disque simple. Cependant, ce n’est pas génial en termes de redondance. En effet, si l’un de ces lecteurs devait ne plus fonctionner (disons le lecteur 1 dans ce cas), les données ne seraient pas répliquées ailleurs, ce qui cause problème si il y a besoin de les récupérer.

RAID 1

Configuration RAID 1

Le niveau suivant est le RAID 1, qui reprend le concept de mirroring dont nous avons parlé précédemment. Cette configuration nécessite là aussi deux lecteurs, afin de miroiter les données du 1er lecteur vers le second. Cela signifie que si le lecteur 1 tombait en panne dans cette configuration, il serait possible de restaurer les données sans problème (car les mêmes données sont sur le lecteur 2). Le RAID 1 ajoute la redondance, sous sa forme la plus basique en matière de RAID, et améliore la sécurité des données.

RAID 5

Configuration RAID 5
Passons maintenant à des niveaux plus complexes et voyons en particulier le système RAID 5. Celui-ci introduit le concept de parité : la distribution de données sur plusieurs lecteurs, pour faciliter la récupération. Vous pouvez voir ici que nous avons quatre disques dans cette configuration (le RAID 5 nécessite au moins trois lecteurs) et vous pouvez voir la parité qui est mise en surbrillance en rouge. Si un disque devait tomber en panne – disons le disque 4 – les données pourraient être reconstruites à l’aide de la parité des autres lecteurs (la parité dans ce RAID 5 prend l’espace d’un lecteur au total et peut donc tolérer la défaillance d’un lecteur).

Avec le RAID 5, vous pouvez aller un peu plus loin et configurer un 5ème lecteur appelé “hot spare”. Il s’agit d’un lecteur inactif inclus dans le système, sans pour autant contenir de données, qui agit comme un disque de secours si jamais un des lecteurs tombait en panne.  Il prend alors la place du lecteur défaillant et reçoit les données des autres lecteurs en respectant le principe de parité. Ainsi aucune donnée n’est perdue. Vous pouvez alors retirer le lecteur défaillant et en insérer un nouveau dans la configuration, qui prend à son tour la fonction de « hot spare ». C’est un autre bon moyen d’ajouter des redondances et éviter ainsi de perdre des données.

RAID 6

Configuration RAID 6

Pour finir, nous avons le RAID 6, qui pousse plus loin encore le concept de parité avec la «double parité». Vous pouvez voir dans le schéma RAID 6, que nous avons cinq lecteurs (le RAID 6 nécessite au minimum quatre lecteurs). Vous pouvez également constater que la double parité est répartie entre eux, prenant l’espace de deux disques au total : 2 lecteurs peuvent alors connaître des défaillances simultanément sans pour autant compromettre les chances de récupérer les données !

Il convient toutefois de préciser que la redondance et la parité sont deux choses différentes de la sauvegarde. N’oubliez donc pas de conserver des sauvegardes distinctes de votre système RAID.

Et vous, utilisez-vous un système RAID ? Quel niveau avez-vous choisi et pour quelles raisons ? Partagez votre expérience avec nous en tweetant @KrollOntrack_FR.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *