Au fil des ans, les systèmes de stockages sont devenus partie intégrante du système informatique. Ils ont évolué au même titre que les autres composants informatiques. Introduit il y a plus de 20 ans, le système de stockage RAID a suivi cette évolution et constitue aujourd'hui une excellente solution de stockage de masse pour les systèmes d'entreprise.

Historique du système RAID

RAID est l'acronyme de Redundant Array of Inexpensive Disks (matrice redondante de disques indépendants). Le concept est né à l'université de Californie, à Berkeley, où David A. Patterson, Garth Gibson et Randy H. Katz collaboraient en vue de produire des prototypes opérationnels de cinq niveaux de systèmes de stockage RAID. Le résultat de leurs recherches a formé la base des systèmes de stockage RAID complexes qui existent de nos jours. Aujourd'hui IBM détient les droits de propriété intellectuelle sur RAID 5.

La conception du système de stockage RAID visait notamment à améliorer les performances, la récupération, la fiabilité et l'évolutivité du stockage. Il en a résulté un concept unique de redondance offrant des possibilités de récupération de données dans le cas où un disque tomberait en panne dans le système. En fait, les cartes contrôleurs RAID ont alors acquis la capacité de continuer à lire et écrire des données même si un disque est "hors ligne".

Présentation du système RAID

Un certain nombre de configurations standards ont été élaborées et sont référencées en termes de niveaux. A l'origine, il y avait cinq niveaux de RAID mais depuis, beaucoup d'autres variantes ont vu le jour, notamment plusieurs niveaux imbriqués et de nombreux niveaux non-standards (le plus souvent propriétaires).

Un RAID combine des disques durs physiques en une seule unité logique à l'aide, soit d’un matériel spécial, soit d’un logiciel. Les solutions du RAID matériel peuvent prendre une variété de styles tels qu’une construction sur la carte mère, un ajout de cartes, ou encore à plus grande échelle les serveurs NAS ou SAN. Ainsi, le système d’exploitation considère chaque volume RAID comme un disque et n’a pas connaissance de ses constituants physiques. Les solutions de RAID logiciel sont, quant à elles, généralement mises en œuvre directement dans le système d'exploitation.

Il existe trois concepts clés dans le RAID : le "mirroring" (miroitage, en français) consiste à copier des données sur plusieurs disques, le volume agrégé par bandes (connu sous le nom de "striping" en anglais) qui autorise la division des données au travers d’au minimum deux disques et enfin, la correction d'erreur, là où les données redondantes sont stockées afin de détecter les problèmes et éventuellement les réparer (communément appelée la tolérance aux pannes). Les différents niveaux de RAID utilisent une ou plusieurs de ces techniques, en fonction de la configuration système requise.

RAID est traditionnellement utilisé sur les serveurs, mais peut être aussi utilisé sur les postes de travail. Ce dernier cas s’avère particulièrement vrai lors de stockages physiques sur des ordinateurs tels que ceux utilisés pour des montages vidéo et audio.

Le cœur du système de stockage RAID est la carte contrôleur. Cette carte est généralement une carte contrôleur de disque dur SCSI ( toutefois, les cartes contrôleurs RAID IDE se généralisent). Ses fonctions sont de :

  • gérer les disques durs individuels,
  • fournir une configuration de système logique,
  • accomplir des opérations redondantes ou tolérantes aux pannes.

Le contrôleur RAID traduit et communique directement avec les disques durs. Certaines cartes contrôleurs s'accompagnent d'outils complémentaires pour intervenir spécifiquement sur les disques, tels qu'une fonction d'analyse de surface et un utilitaire de formatage de disque. Dans le cas des cartes basées sur SCSI, ces contrôleurs offrent des options supplémentaires pour la gestion des disques.

Configurations RAID

La configuration du système logique répartit les données par bandes sur l'ensemble des disques physiques. Cela permet d'avoir un débit de données équilibré sur l'ensemble des disques : au lieu d'avoir un disque qui fait tout le travail de lecture et d'écriture des données, tous les disques travaillent ensemble. Les données sont ainsi réparties sur l'ensemble des disques physiques.

Opérations redondantes ou tolérantes aux pannes

La redondance dans une configuration RAID 5 courante est le résultat de l'utilisation d'une fonction mathématique booléenne appelée "OU exclusif" (XOR). C'est ce qu'on qualifie communément de parité. La fonction XOR est un processus binaire logique. Le mieux est de considérer la parité comme une combinaison des blocs de données de l'autre disque. Chaque octet qui est écrit dans un bloc de données est calculé par rapport aux autres blocs de données. La parité ainsi obtenue est écrite dans le bloc de parité pour cette bande donnée. Si cette fonction est tellement unique, c'est parce que le calcul fonctionnera toujours, quel que soit le bloc de données manquant. Toutefois, les limitations de RAID 5 sont qu'un seul bloc de données peut être manquant : le calcul ne fonctionnera pas s'il manque deux blocs. Dans l'environnement de travail, cela signifie qu'un seul disque peut tomber en panne. La configuration RAID 5 n'offrira pas une redondance adéquate si deux disques ou plus tombent en panne.

Comme indiqué précédemment, la carte contrôleur répartit les données par bandes et exécute également la fonction XOR sur ces données. La quantité de calculs logiques qu'accomplit le contrôleur à chaque seconde est impressionnante. Les contrôleurs RAID actuels sont des systèmes matériels très sophistiqués, incluant des processeurs et des bancs de mémoire SDRAM spécialement conçus pour offrir performances et redondance.

Configurations RAID

La récupération de données RAID

Bien que les systèmes de stockage RAID soient conçus pour résister aux pannes, certaines défaillances matérielles, ou autres, peuvent rendrent vos données inaccessibles. Si votre système rencontre de tels problèmes avec sa matrice RAID, Ontrack Data Recovery maîtrise les procédures et les techniques de récupération de données RAID.

Nos ingénieurss'accordent à dire que la récupération de matrices RAID est l'un des aspects techniques les plus difficiles de la récupération de données. L'évaluation d'une récupération de système RAID est en fait la combinaison de deux étapes très importantes :

  1. La première, et la plus longue, est le réassemblage de la matrice. Lorsque les ingénieurs d'Ontrack Data Recovery réassemblent le système logique, ils ont mené au préalable des recherches approfondies sur la façon dont les données sont organisées sur l'ensemble des disques. Ils connaissent ainsi l'ordre des disques et la disposition des blocs de données et des blocs de parité. Cet investissement en temps est nécessaire pour déterminer la configuration d'origine et obtenir une récupération de qualité,

  2. La seconde étape consiste à travailler sur le système de fichiers logique. Les systèmes actuels de fichiers journaux d'entreprise sont extrêmement complexes. Si la matrice RAID est en panne, il y aura des milliers d'erreurs au sein du système de fichiers. Les ingénieurs d'Ontrack Data Recovery vérifient et confirment que la matrice est structurée correctement avant de copier la moindre donnée. Cette étape supplémentaire garantit une récupération de qualité.

Récupération de données RAID

Vocabulaire RAID couramment utilisé

RAID : technologie qui permet l'utilisation de 2 ou plusieurs disques durs dans diverses configurations afin d’obtenir une meilleure performance, plus de fiabilité et de plus grandes capacités de volumes à l’aide de l'utilisation de la consolidation de ressources de disque et des calculs paritaires.
Parité : calcul mathématique qui permet aux disques présents dans une matrice RAID de tomber en panne sans que l’on ne constate de perte de données. L’illustration la plus probante est l'équation : A + B = C. Vous pouvez supprimer n'importe quelle lettre et attribuer à sa valeur les 2 lettres restantes. Par exemple, si B est retiré l'équation ressemblait à A + ? = C, alors la valeur B peut être formulée en déplaçant la donnée A, ainsi B = C - A. C'est évidemment une façon simpliste de décrire la parité. Si l’on a l’ambition de comprendre complètement ce mécanisme pour un RAID, alors la connaissance du binaire et de l’expression logique XOR est nécessaire.
Mirroring : les données d'un ou plusieurs disques durs sont dupliquées au minimum sur un autre disque physique.
Striping : la méthode par laquelle les données et la parité peuvent être écrites sur plusieurs disques. Dans l'exemple ci-dessous les données sont écrites dans les disques dans un ordre séquentiel jusqu'au dernier disque, elles regagnent ensuite le premier et commencent une seconde bande.
Bloc : un bloc est l’espace logique de chaque disque où les données sont écrites, la capacité de l'espace est fixée par le contrôleur RAID et serait généralement d’une taille comprise entre 256KB et 16 Ko. Les données remplissent l'espace jusqu'à ce que la capacité limite soit atteinte, puis circulent sur le disque suivant, et ainsi de suite jusqu'au dernier. Une fois le circuit bouclé, les données se positionnent directement au début de la bande suivante.
Symétrie Gauche / Droite : la symétrie dans un RAID contrôle la manière dont les données et la parité sont réparties sur les disques. Il ya 4 principaux types de symétrie, chacune d’entre elles est utilisée selon le vendeur du RAID. Certaines entreprises font aussi des types de propriété en fonction de leurs besoins.
Hot Spare : il existe différentes méthodes pour faire un dépannage RAID, l’une d’entre elles est l'utilisation d'un disque de secours. C’est un disque de rechange qui peut être utilisé à la place de celui altéré.
En mode dégradé lorsqu’une unité du RAID devient illisible, le disque est alors considéré comme mauvais et est retiré du RAID. Les nouvelles données et la parité sont alors écrites sur les autres disques du RAID. Si une de ces données est sollicitée depuis le disque défaillant, alors elle est transférée grâce à la parité sur les autres. Cela dégrade les performances du RAID, d'où l’appellation mode dégradé.

Démarrez votre récupération de données !

Contactez notre équipe de spécialistes, Kroll Ontrack compte des centaines d'ingénieurs qualifiés à travers le monde pour traiter tous les cas de récupération de données perdues.

0 800 10 12 13 Demande de devis gratuit