Go to Top

Reconstructions de disques et de systèmes RAID (2ème partie)

Récupération de serveur RAID

Cet article fait suite au comparatif initial entre reconstructions de disques et de systèmes RAID. Le premier article a suscité plusieurs questions au sujet des reconstructions de disques et de systèmes RAID et de la façon d’empêcher la perte de données. Cette seconde partie tentera de répondre à ces questions.

Un de nos lecteurs nous a fait la remarque suivante : « Dans votre premier exemple, la parité est absente de la bande 4. Vous n’avez pas mentionné comment cette bande peut être recréée en l’absence de parité. »

RAID 5 en mode dégradé

La parité est absente de la bande 4 parce qu’elle doit être sur le disque manquant ou endommagé. En d’autres termes, dans une matrice saine, elle figurerait tout en haut de la bande 4. Quant à la façon de la recréer, dans cet exemple, toutes les données sont intactes et le secteur de parité dans la bande 4 du disque dur 1 sera recréé en appliquant l’opération OU exclusif (XOR) sur les données des disques 2 à 4 (P4 = XOR (D9, D8, D7)). Voir ci-dessous une représentation du disque recréé.

RAID 5 : disque reconstruit

Une autre question qui est revenue plusieurs fois depuis le premier article concerne les autres façons dont les données peuvent être perdues ou endommagées sur les disques ou systèmes RAID.

Un de nos lecteurs nous a demandé : « Votre second exemple montre comment les données peuvent être perdues si le mauvais type de reconstruction est effectué, « comme » la reconstitution de la parité. Est-ce le seul cas ? Le « comme » implique qu’il pourrait y avoir d’autres reconstructions susceptibles de causer des problèmes. »

Reconstructions pouvant entraîner une perte de données

Il existe plusieurs types de reconstructions susceptibles d’entraîner une perte de données. En voici une liste non exhaustive.

  • Reconstitution de la parité avec un disque mis à zéro (parité écrasée),
  • Reconstitution de la parité avec un disque dégradé (forcé en ligne et parité écrasée),
  • Reconstitution de la parité avec des disques dans le désordre (parité et données écrasées),
  • Reconstruction d’un système RAID avec un disque manquant (parité et données écrasées),
  • Reconstruction d’un système RAID avec une taille de bande différente (parité et données écrasées),
  • Reconstruction d’un système RAID avec une configuration différente (parité et données écrasées).

Par exemple, l’un des cas de perte de données que nous rencontrons le plus souvent sur un système RAID est lorsque la parité est mise à jour avec un disque mis à zéro dans la configuration RAID (reconstruction du système RAID au lieu du disque dur). Ce type de reconstruction détruit la parité d’origine et empêche une reconstruction du disque. Une fois la parité écrasée, les données utilisateur manquantes sur le disque dur manquant ou endommagé ne peuvent plus être recréées.

Un autre scénario possible de perte de données est une matrice RAID dans le désordre, notamment durant une reconstruction de système RAID. La reconstitution de la parité sur des disques qui sont dans le désordre peut finir par écraser des données utilisateur valides.

RAID 5 : disques en désordre

Dans l’exemple ci-avant, les données qui figuraient initialement sur la bande 1 du disque dur 3 sont désormais écrasées par la nouvelle parité. La parité qui figure sur la bande 1 du disque dur 4 se retrouve traitée comme des données utilisateur plutôt que comme une parité, ce qui provoque une altération logique. En outre, les données qui se trouvent sur la bande 1 du disque dur 2 sont biaisées, contribuant également à l’altération du volume logique. Toutes les zones identifiées en rouge seront endommagées.

Même si vous ne procédez pas à la reconstitution de la parité, il restera toujours une altération du volume logique. Cette altération logique déclenche souvent l’exécution d’outils de réparation de volume (CHKDSK, FSCK, etc.). Ces utilitaires de réparation essaieront de « corriger » l’altération logique, alors que les dégâts se situent en réalité au niveau du système RAID ; ils causeront donc encore plus de dégâts, notamment en supprimant des métadonnées et en rendant le système irrécupérable.

Un autre scénario est lorsqu’un système RAID est reconstruit après la panne de deux disques en utilisant un disque dégradé qui a été forcé en ligne et un nouveau disque. Une telle reconstruction écrasera la parité valide par une nouvelle parité non valide, de sorte que le système sera souvent irrécupérable ou les données inexploitables.

Le dernier exemple est lorsque la configuration RAID change et que les zones de parité et de données sont écrasées par la nouvelle configuration.

Supposons pour les besoins de cet exemple que nous ayons une matrice RAID 5 avec une taille de bande de 64 Ko. Le système d’exploitation lira les données des bandes en commençant par le disque dur 1 et les données représentées par M1. Il enchaînera ensuite avec M2, puis D1, etc.

RAID 5 - NTFS Volume

Si le contrôleur de matrice perd la configuration et que l’utilisateur force la mauvaise configuration, les données seront endommagées. Dans notre exemple, l’utilisateur a forcé une nouvelle configuration avec une taille de bande de 32 Ko, séparant les données en deux.

RAID 5 - Nouvelle configuration

Le système d’exploitation lira la première moitié de la première section des métadonnées représentée par M1.1. Ensuite, il passera au disque suivant de la bande et lira la première moitié de la section suivante des métadonnées représentée par M2.1. Cela engendrera une altération logique, rendant les données inexploitables. Cette situation déclenchera souvent l’exécution d’outils de réparation de volume pour « réparer » les dégâts logiques, ce qui peut causer des dommages supplémentaires et même rendre le volume irrécupérable.

Conseils pour récupérer en toute sécurité des données suite à ce type de perte

Comment donc vous protéger si vous vous retrouvez dans une telle situation ? Voici quelques conseils pour empêcher ce type de perte de données des disques ou systèmes RAID.

  • Faites une image des disques avant de tenter une reconstruction : Ainsi, si la reconstruction échoue, vos données sont protégées. Assurez-vous que le programme de création d’images que vous choisissez permet d’obtenir une image du disque au niveau des blocs/secteurs ou adaptée à la recherche de preuves,
  • Restaurez les sauvegardes sur un volume différent : Cela garantit que tous les fichiers importants sont corrects sur la sauvegarde avant d’écraser éventuellement les données sur le volume actif,
  • En cas de problème sur un RAID, testez la sauvegarde en la restaurant à un emplacement différent ou faites une image de chaque disque du système RAID avant de tenter une reconstruction. Il arrive en effet qu’une reconstruction d’un système RAID ne fonctionne pas correctement et aggrave le problème,
  • Ne créez aucun nouveau fichier sur le disque nécessitant une récupération et cessez d’exécuter les applications jusqu’à la récupération des données importantes. Les nouveaux fichiers peuvent écraser les fichiers nécessitant une récupération,
  • N’exécutez pas les outils de réparation du système de fichiers FSCK ou CHKDSK sur un disque virtuel à moins d’avoir vérifié qu’une sauvegarde est valide en la restaurant sur un volume différent. Ces outils de réparation partent du principe qu’il existe une sauvegarde valide des données et peuvent écraser des pointeurs de fichiers pour assurer la cohérence du système de fichiers. Le cas échéant, ces outils peuvent être exécutés en mode lecture seule pour détecter de graves altérations avant que les réparations ne soient effectuées,
  • Ne supprimez aucun autre fichier avant une récupération de données supprimées. La suppression de fichiers inclut le déplacement de fichiers de la source vers un autre volume. Un déplacement équivaut en effet à une copie suivie d’une suppression. Si vous avez besoin d’une copie des données de la source, veillez à les copier et non à les déplacer. Des fichiers supprimés supplémentaires peuvent compliquer la récupération des données,
  • N’essayez pas les logiciels de récupération de données, sauf si vous avez la certitude qu’ils n’écriront rien sur le disque à récupérer. Certains logiciels de récupération essaieront d’écrire sur le disque source et risquent de nuire aux tentatives de récupération ultérieures,
  • Contactez un spécialiste de la récupération de données RAID  avant de tenter la récupération vous-même. Un spécialiste peut identifier les répercussions qu’aura votre plan sur la possibilité de récupération des données et proposer des pistes pour vous aider à récupérer vous-même vos données.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *