Comprendre le stockage RAID

Au fil des ans, les systèmes de stockages sont devenus partie intégrante du système informatique. Ils ont évolué au même titre que les autres composants informatiques.

Introduit il y a plus de 20 ans, le système de stockage RAID a suivi cette évolution et constitue aujourd'hui une excellente solution de stockage de masse pour les systèmes d'entreprise.

0 800 10 12 13 Evaluation gratuite

Définition d’un système de stockage RAID

La définition du RAID tient dans le nom même du système. En effet, RAID signifie Redundant Array of Independent Disks, ce qui veut dire littéralement regroupement redondant de disques indépendants.

Il s’agit de mettre en grappe plusieurs disques durs pour en obtenir une partition logique unique. En clair, à partir de plusieurs disques durs physiques, on obtient un seul espace visible par le système d’exploitation. En fonction de l’objectif, le RAID permet d'accroître la performance d’accès et d’écriture des données ou améliorer la sécurité des informations.

Parmi les types de RAID existants, il y a le RAID logiciel qui est géré par le système d’exploitation compatible. C’est le moyen le plus abordable pour mettre en commun plusieurs unités de stockage, mais il est nécessaire de disposer d’une bonne ressource pour gérer les différents disques durs.

Il y a également les cartes mères qui acceptent un montage matériel primaire. En clair, la carte mère est capable de gérer les disques durs mis en commun. Enfin, il y a les contrôleurs RAID dédiés qui disposent souvent d’une mémoire cache et d’une mémoire dédiées. Le système dispose alors d’une partition logique unique, et il est tout à fait possible dans le cas d’un RAID un d’effectuer un hot swap ou remplacement à chaud.

Qu'est-ce qu'un système de stockage RAID

Concrètement, un RAID consiste à combiner plusieurs disques durs qui apparaissent comme un disque unique. Ce système garantit une meilleure performance du disque, mais pas seulement.

De par le fonctionnement du RAID qui consiste à dupliquer tout ou une partie des données - d’où l’utilisation du terme redondant dans sa définition - le RAID offre par ailleurs une meilleure résilience. Vos données sont mieux protégées car le RAID présente une meilleure tolérance aux pannes.

Une fois que vous avez compris ce que veut dire RAID, vous appréhenderez plus facilement les différents niveaux de système RAID. Sur ce point justement, que veut dire RAID 0, RAID 1, RAID 5, RAID 10... ? À quoi correspondent exactement ces chiffres ? Tout simplement à la configuration du RAID. Le choix du système se fera essentiellement en fonction de vos besoins en sachant que tous les systèmes RAID permettent de stocker efficacement les données.

Le RAID 1 par exemple répond aux besoins de performance et de fiabilité. Le RAID 5 constitue un choix judicieux si vous recherchez à la fois la performance et une grande tolérance aux pannes.

Votre satisfaction vaut plus que toutes les récompenses !

Historique de la technologie RAID

RAID est l'acronyme de Redundant Array of Inexpensive Disks (matrice redondante de disques indépendants). Le concept est né à l'université de Californie, à Berkeley, où David A. Patterson, Garth Gibson et Randy H. Katz collaboraient en vue de produire des prototypes opérationnels de cinq niveaux de systèmes de stockage RAID.

Le résultat de leurs recherches a formé la base des systèmes de stockage RAID complexes qui existent de nos jours. Aujourd'hui IBM détient les droits de propriété intellectuelle sur RAID 5.

La conception du système de stockage RAID visait notamment à améliorer les performances, la récupération, la fiabilité et l'évolutivité du stockage. Il en a résulté un concept unique de redondance offrant des possibilités de récupération de données dans le cas où un disque tomberait en panne dans le système. En fait, les cartes contrôleurs RAID ont alors acquis la capacité de continuer à lire et écrire des données même si un disque est "hors ligne".

Présentation du système RAID

Un certain nombre de configurations standards ont été élaborées et sont référencées en termes de niveaux. A l'origine, il y avait cinq niveaux de RAID mais depuis, beaucoup d'autres variantes ont vu le jour, notamment plusieurs niveaux imbriqués et de nombreux niveaux non-standards (le plus souvent propriétaires).

Un RAID combine des disques durs physiques en une seule unité logique à l'aide, soit d’un matériel spécial, soit d’un logiciel. Les solutions du RAID matériel peuvent prendre une variété de styles tels qu’une construction sur la carte mère, un ajout de cartes, ou encore à plus grande échelle les serveurs NAS ou SAN. Ainsi, le système d’exploitation considère chaque volume RAID comme un disque et n’a pas connaissance de ses constituants physiques. Les solutions de RAID logiciel sont, quant à elles, généralement mises en œuvre directement dans le système d'exploitation.

Il existe trois concepts clés dans le RAID : le "mirroring" (miroitage, en français) consiste à copier des données sur plusieurs disques, le volume agrégé par bandes (connu sous le nom de "striping" en anglais) qui autorise la division des données au travers d’au minimum deux disques et enfin, la correction d'erreur, là où les données redondantes sont stockées afin de détecter les problèmes et éventuellement les réparer (communément appelée la tolérance aux pannes). Les différents niveaux de RAID utilisent une ou plusieurs de ces techniques, en fonction de la configuration système requise.

RAID est traditionnellement utilisé sur les serveurs, mais peut être aussi utilisé sur les postes de travail. Ce dernier cas s’avère particulièrement vrai lors de stockages physiques sur des ordinateurs tels que ceux utilisés pour des montages vidéo et audio.

Le cœur du système de stockage RAID est la carte contrôleur. Cette carte est généralement une carte contrôleur de disque dur SCSI ( toutefois, les cartes contrôleurs RAID IDE se généralisent). Ses fonctions sont de :

gérer les disques durs individuels,
fournir une configuration de système logique,
accomplir des opérations redondantes ou tolérantes aux pannes.

Le contrôleur RAID traduit et communique directement avec les disques durs. Certaines cartes contrôleurs s'accompagnent d'outils complémentaires pour intervenir spécifiquement sur les disques, tels qu'une fonction d'analyse de surface et un utilitaire de formatage de disque. Dans le cas des cartes basées sur SCSI, ces contrôleurs offrent des options supplémentaires pour la gestion des disques.

Configurations et niveaux RAID

La configuration du système logique répartit les données par bandes sur l'ensemble des disques physiques. Cela permet d'avoir un débit de données équilibré sur l'ensemble des disques : au lieu d'avoir un disque qui fait tout le travail de lecture et d'écriture des données, tous les disques travaillent ensemble. Les données sont ainsi réparties sur l'ensemble des disques physiques.

Opérations redondantes ou tolérantes aux pannes

La redondance dans une configuration RAID 5 courante est le résultat de l'utilisation d'une fonction mathématique booléenne appelée "OU exclusif" (XOR). C'est ce qu'on qualifie communément de parité. La fonction XOR est un processus binaire logique. Le mieux est de considérer la parité comme une combinaison des blocs de données de l'autre disque. Chaque octet qui est écrit dans un bloc de données est calculé par rapport aux autres blocs de données. La parité ainsi obtenue est écrite dans le bloc de parité pour cette bande donnée. Si cette fonction est tellement unique, c'est parce que le calcul fonctionnera toujours, quel que soit le bloc de données manquant. Toutefois, les limitations de RAID 5 sont qu'un seul bloc de données peut être manquant : le calcul ne fonctionnera pas s'il manque deux blocs. Dans l'environnement de travail, cela signifie qu'un seul disque peut tomber en panne. La configuration RAID 5 n'offrira pas une redondance adéquate si deux disques ou plus tombent en panne.

Comme indiqué précédemment, la carte contrôleur répartit les données par bandes et exécute également la fonction XOR sur ces données. La quantité de calculs logiques qu'accomplit le contrôleur à chaque seconde est impressionnante. Les contrôleurs RAID actuels sont des systèmes matériels très sophistiqués, incluant des processeurs et des bancs de mémoire SDRAM spécialement conçus pour offrir performances et redondance.

Vocabulaire RAID couramment utilisé

RAID : technologie qui permet l'utilisation de 2 ou plusieurs disques durs dans diverses configurations afin d’obtenir une meilleure performance, plus de fiabilité et de plus grandes capacités de volumes à l’aide de l'utilisation de la consolidation de ressources de disque et des calculs paritaires.
Parité : calcul mathématique qui permet aux disques présents dans une matrice RAID de tomber en panne sans que l’on ne constate de perte de données. L’illustration la plus probante est l'équation : A + B = C. Vous pouvez supprimer n'importe quelle lettre et attribuer à sa valeur les 2 lettres restantes. Par exemple, si B est retiré l'équation ressemblait à A + ? = C, alors la valeur B peut être formulée en déplaçant la donnée A, ainsi B = C - A. C'est évidemment une façon simpliste de décrire la parité. Si l’on a l’ambition de comprendre complètement ce mécanisme pour un RAID, alors la connaissance du binaire et de l’expression logique XOR est nécessaire.
Mirroring : les données d'un ou plusieurs disques durs sont dupliquées au minimum sur un autre disque physique.
Striping : la méthode par laquelle les données et la parité peuvent être écrites sur plusieurs disques. Dans l'exemple ci-dessous les données sont écrites dans les disques dans un ordre séquentiel jusqu'au dernier disque, elles regagnent ensuite le premier et commencent une seconde bande.
Bloc : un bloc est l’espace logique de chaque disque où les données sont écrites, la capacité de l'espace est fixée par le contrôleur RAID et serait généralement d’une taille comprise entre 256KB et 16 Ko. Les données remplissent l'espace jusqu'à ce que la capacité limite soit atteinte, puis circulent sur le disque suivant, et ainsi de suite jusqu'au dernier. Une fois le circuit bouclé, les données se positionnent directement au début de la bande suivante.
Symétrie Gauche / Droite : la symétrie dans un RAID contrôle la manière dont les données et la parité sont réparties sur les disques. Il ya 4 principaux types de symétrie, chacune d’entre elles est utilisée selon le vendeur du RAID. Certaines entreprises font aussi des types de propriété en fonction de leurs besoins.
Hot Spare : il existe différentes méthodes pour faire un dépannage RAID, l’une d’entre elles est l'utilisation d'un disque de secours. C’est un disque de rechange qui peut être utilisé à la place de celui altéré.
En mode dégradé lorsqu’une unité du RAID devient illisible, le disque est alors considéré comme mauvais et est retiré du RAID. Les nouvelles données et la parité sont alors écrites sur les autres disques du RAID. Si une de ces données est sollicitée depuis le disque défaillant, alors elle est transférée grâce à la parité sur les autres. Cela dégrade les performances du RAID, d'où l’appellation mode dégradé.

Questions fréquentes

Une matrice RAID réalise-t-elle des sauvegardes automatiques ?

Pouvez-vous récupérer des données depuis une configuration RAID 0?

Que dois-je faire si mon système RAID tombe en panne?

Quel est le niveau de RAID le plus fiable ?

Quelle est la différence entre RAID et NAS?

Est-il possible de récupérer des données sur un volume RAID 5 formaté ?

Quelles sont les raisons les plus courantes de corruption de données ou de défaillance RAID ?

Démarrez l’évaluation gratuite de votre support !

Envoyez-nous gratuitement votre support de stockage pour recevoir une estimation du taux de récupération et un devis fixe sans engagement, ou demandez à être recontacté pour une estimation du tarif de votre récupération de données.

Si vous le souhaitez, nous pouvons planifier un enlèvement gratuit de votre support et effectuer son analyse dans notre laboratoire en région parisienne. Nous vous enverrons ensuite le résultat de l'évaluation avec une offre à prix fixe, que vous pourrez accepter ou refuser. L'évaluation pour les disques simples et les systèmes RAID est effectuée dans les 4 heures suivant la réception des supports. L'analyse est gratuite pour ces supports de stockage :

HDD : disques durs mécaniques,
Supports de stockage externes : HDD et SSD,

SSD : supports de stockage à semi-conducteurs,
Systèmes RAID et NAS.

Pour certains supports de stockage et dommages, l'analyse gratuite n'est pas possible. Nous proposons alors un diagnostic payant d'un montant de 300 € TTC. Si une récupération de données est possible, nous vous enverrons une estimation du taux de récupération et une offre à prix fixe, que vous pourrez également accepter ou refuser. La durée du diagnostic est d'environ 4 à 10 jours ouvrés. Ces supports et dommages sont les suivants :

Smartphones et tablettes,
Supports Flash (clé USB, cartes SD...),
Support de stockage déjà ouvert,

Données supprimées ou supports formatés,
Dommages liquides et incendie.

Remplissez le formulaire suivant pour démarrer votre évaluation. Pour obtenir une assistance immédiate, appelez-nous directement au 0 800 10 12 13.

Regarder

icon

Télécharger

Apprendre

Système RAID : Présentation et fonctionnement

Définition d’un système de stockage RAID

Qu'est-ce qu'un système de stockage RAID

Historique de la technologie RAID

Présentation du système RAID

Configurations et niveaux RAID

Opérations redondantes ou tolérantes aux pannes

Vocabulaire RAID couramment utilisé

Questions fréquentes

Démarrez l’évaluation gratuite de votre support !

Pour quel type d'appareils avez-vous besoin de récupérer des données ?

Quelle est la cause principale de votre perte de données ?

Informations complémentaires ? Quelles sont vos données les plus critiques ?

1. Coordonnées du contact

2. Détails expédition