La récupération de données est une expression qui revient souvent dans les revues informatiques et sur les affiches publicitaires des aéroports. Tapez "récupération de données" dans un moteur de recherche et vous verrez qu'internet est saturé de liens sur le sauvetage des données.
D'où la question : qu'est-ce que la récupération de données ?
Le Petit Larousse définit le mot récupérer par "Rentrer en possession de, retrouver, après avoir perdu". Les synonymes de récupération sont : recouvrement, reconquête, ressaisissement et rapatriement. Les mots associés sont : régénération, rédemption et sauvetage. Dans l'environnement informatique, les données des fichiers peuvent représenter toutes sortes de types d'informations : photos, musique, multimédia, feuilles de calcul et documents.
Dans ce contexte, la récupération de données est le recouvrement de données originales perdues ou manquantes. Les données informatiques sont fluctuantes ; elles changent constamment. Cet article, par exemple, a connu six versions préliminaires. Tandis que le contenu était globalement le même durant le processus d'écriture, la version six est très différente de la version une. Si ce fichier de document était égaré avant la publication, j'aimerais disposer de la version originale la plus récente, et non d'une copie de la dernière sauvegarde. Si je n'avais jamais fait de sauvegarde de cet article, il me faudrait absolument avoir l'original.
Quelles sont les options qui s'offrent à vous en cas de perte de données ? L'article de ce mois va se concentrer sur ce qu'est la récupération de données et révéler quelques idées fausses qui y sont associées. Nous aborderons également le pour et le contre des logiciels de récupération de données.
La récupération de données est nécessaire lorsque l'accès aux données d'un fichier échoue. Ce point de défaillance peut être causé par des problèmes physiques ou électroniques avec le périphérique de stockage. Lorsque le périphérique de stockage présente un problème physique, l'urgence est de le rendre opérationnel à nouveau afin de pouvoir lire et extraire les données. (Pour en savoir plus sur les récupérations en salle blanche, consultez les articles techniques précédents dans la rubrique des documents de référence.)
Si le périphérique de stockage ne présente pas de problème, mais que les fichiers sont inaccessibles, il est probable que le point de défaillance soit provoqué par des erreurs au sein du système de fichiers. Tous les périphériques de stockage ont besoin d'un système pour organiser et mettre en correspondance les fichiers stockés. Lorsque les informations de ce système de fichiers sont altérées, les données peuvent toujours résider physiquement sur le périphérique, mais les "pointeurs" ou "mises en correspondance" vers les fichiers nécessitent d'être réparés pour rétablir le lien entre le nom des fichiers et les données de ces fichiers.
Étudions la réparation du système de fichiers. La plupart des utilisateurs ayant une connaissance fonctionnelle de leur système d'exploitation peuvent être familiarisés avec certains des outils de réparation de volume (la quantité physique d'espace de stockage du disque dur, de taille fixe, qui se trouve au plus haut niveau de la structure de répertoire) qui sont livrés avec leur système. Par exemple, les utilisateurs de Microsoft ® DOS et Windows ® connaissent les programmes Scandisk et CHKDSK, ceux d'UNIX et de Linux connaissent le programme FSCK, les administrateurs de Novell® Netware connaissent les programmes VREPAIR et REBUILD, et les utilisateurs d'Apple® Mac connaissent le programme DISK FIRST AID.
Ces utilitaires sont parfois qualifiés d'outils de récupération de données, car ils réparent le système de fichiers. Il serait plus juste de les décrire comme des outils de "réparation de volume". En effet, ils ne vérifient pas les données des fichiers ; l'analyse porte sur le système de fichiers proprement dit. L'objectif de ces outils est de s'assurer que le volume est "cohérent" ou sans erreur.
Comme ces utilitaires sont conçus pour réparer le volume, toutes les références au système de fichiers (ou "pointeurs") qui sont incorrectes ou en conflit avec d'autres "pointeurs" seront rectifiées. Les utilitaires de réparation commenceront à apporter des changements automatiques au système de fichiers pour éliminer ces conflits, sacrifiant les données afin de rendre le volume cohérent.
Beaucoup se demandent pourquoi ces utilitaires créent autant de dégâts. La réponse réside dans la raison d'être de ces programmes. Ces utilitaires sont des outils de réparation de volume, et non des outils de récupération de données. À leur décharge, la plupart ont une sorte de mode en "lecture seule" qui vous permettra de voir les problèmes détectés sans les résoudre automatiquement. À vous de choisir ensuite si vous voulez autoriser l'utilitaire à s'exécuter.
Qu'en est-il des outils de récupération de données en libre-service que l'on peut trouver sur internet ? Présentent-ils une quelconque valeur ? Ces types d'outils logiciels sont conçus par des individus ou des entreprises qui ont une bonne connaissance fonctionnelle des systèmes de fichiers. L'objectif de conception de ces logiciels est d'être plus intelligents que les utilitaires de réparation de volume, et aussi de trouver les données vers lesquelles le système de fichiers ne pointe plus. Les outils de récupération de données en libre-service analysent le système de fichiers et les données, et fournissent un moyen de voir ou de copier les fichiers trouvés. En général, la plupart de ces outils recherchent :
Pour des analyses étendues ou avancées des supports de stockage, les logiciels peuvent occulter les structures de début et ne rechercher que les structures de système de fichiers ou des types de fichiers spécifiques. Cette recherche avancée peut trouver les noms de fichiers que vous aviez, pourtant les données peuvent être inutilisables ou illisibles.
Si ces logiciels de récupération de données présentent des résultats limités, c'est à cause du chemin préprogrammé que les logiciels utilisent pour trouver les fichiers manquants. Ces algorithmes de récupération préprogrammés suivent un trajet défini. Ce type de logiciels automatisés doit commencer à chercher en partant d'hypothèses sur les définitions de volume. Si ces hypothèses sont inexactes, les résultats laisseront à désirer. Par exemple, l'une de ces hypothèses peut être l'endroit où la partition et le volume commencent : si aucune référence fiable ne peut être trouvée pour le début du volume ou si un mode "Avancé" est choisi, le logiciel peut commencer à trouver des noms de fichiers que l'utilisateur reconnaît, mais les "pointeurs" vers les données ne concorderont pas avec les données réelles, rendant alors inutilisables les fichiers trouvés.
Un autre exemple d'hypothèse faite par les logiciels de récupération de données automatisés est la taille des blocs ou clusters. Les systèmes de fichiers allouent de l'espace aux fichiers dans des unités appelées clusters. Chaque cluster contient entre 1 et 64 secteurs, selon le type et la capacité du disque. Un cluster est la plus petite unité d'espace de disque pouvant être allouée à l'utilisation par des fichiers. S'il n'existe aucune référence fiable quant à la taille des clusters, le logiciel doit procéder à la meilleure estimation. Si ce détail est erroné, vous pourrez certes voir le nom de vos fichiers mais, là encore, les données seront inexploitables.
Cela veut-il dire que tous les outils logiciels de récupération de données sont sans valeur ? Pas du tout. Les logiciels de récupération automatisés sont formidables pour les situations simples de perte de données impliquant la suppression de partitions, de volumes et de simples données.
Cependant, ces situations de perte de données ne représentent pas tous les scénarios. Dans de nombreux cas, le remède recommandé est de faire appel à l'expertise d'un ingénieur en récupération de données expérimenté. Prenons quelques exemples de perte de données où un ingénieur expérimenté représente le meilleur plan d'action :
Les professionnels de la récupération de données ont l'habitude d'offrir des récupérations de qualité. Dans de nombreux cas, la récupération n'est pas un processus simple, à cause des dommages causés au système de fichiers. Un ingénieur en récupération de données peut identifier visuellement les altérations inhabituelles et les corriger pour que les données des fichiers soient accessibles. À l'aide de calculs complexes, l'ingénieur commencera à déterminer le début du volume de données, puis élaborera des structures pointant vers les fichiers de données de l'utilisateur. Par opposition, les logiciels de récupération de données procèderont à la récupération par la force.
Le processus d'ingénierie humaine présente de nombreux avantages, dont voici un exemple : l'utilisateur a eu recours à une application de partitionnement tierce et le logiciel a planté, laissant les données dans un état incomplet, c'est-à-dire qu'une moitié est transférée vers la nouvelle partition, l'autre moitié est toujours à son emplacement d'origine. Un ingénieur expérimenté remarquera l'altération grave du système de fichiers et s'efforcera de récupérer les deux jeux de données.
Dans le cas des matrices de stockage multidisques ou RAID (matrice redondante de disques indépendants), les ingénieurs aguerris sont le choix de prédilection pour des récupérations de données précises. (Il existe de nombreux types de systèmes RAID différents qui peuvent être mis en place, soit dans du matériel dédié, soit dans des logiciels personnalisés s'exécutant sur du matériel standard. La récupération complexe des matrices RAID 5, 6, 0+1 et 1+0 nécessite une connaissance experte de la façon dont une carte contrôleur RAID distribue les données et une connaissance approfondie des systèmes de fichiers. Les récupérations de grandes matrices de stockage sont généralement un succès grâce aux ingénieurs qui rassemblent les pièces de cet immense "puzzle" de données, même lorsque les bandes de données sont endommagées.
Dans un cas, la configuration RAID d'une grande matrice RAID 5+0 de 32 disques a été perdue. Le département informatique avait subi une coupure d'alimentation, et le contrôleur RAID ne pouvait plus voir le système logique. Le département informatique a essayé de travailler avec le fabricant OEM pour remettre en ligne la matrice de 1,3 To, mais en vain. Les administrateurs du volume de stockage étaient dans l'impasse : la matrice ne pouvait pas être restaurée et toute configuration supplémentaire risquait d'endommager les données restant sur le volume. En l'absence de sauvegarde d'un volume de cette taille, le seul choix était d'engager un professionnel de la récupération de données.
Lorsque les boîtiers des disques sont arrivés, les ingénieurs se sont mis au travail immédiatement afin d'isoler les disques Fibre Channel. En raison de la complexité de la matrice de stockage multidisques, deux ingénieurs confirmés ont travaillé à la remise en service des disques.
Alors que le client affirmait qu'il s'agissait d'une seule grande matrice RAID 5, il s'est avéré qu'il y avait quatre matrices RAID 5 distinctes présentées au logiciel de gestion du stockage. Le logiciel a ensuite agrégé par bandes ces quatre matrices RAID 5 distinctes dans un volume RAID 0. Après une journée de travail, le système complet a été réassemblé manuellement et les données ont pu être copiées. La récupération a réussi à 100 % : aucun des fichiers de données n'a été endommagé. Ce système ne pouvait être rétabli que par des ingénieurs ; les logiciels de récupération automatisés n'auraient pas pu réassembler ces 32 disques.
La façon dont les ordinateurs stockent les données sur des supports est différente pour chaque système d'exploitation. Que les supports en question soient des bandes, CD-ROM, DVD ou disques durs, il existe une méthode d'organisation des données unique pour chaque type de support.
Tous les systèmes de fichiers des disques durs d'ordinateurs peuvent être classés dans deux types de méthodes : l'allocation liée ou l'allocation indexée. De nombreux systèmes de fichiers ont été conçus au fil des ans, et seuls quelques-uns sont utilisés dans l'informatique grand public. Voici quelques exemples des deux catégories de systèmes de fichiers :
|
Allocation liée |
Allocation indexée |
|
|
|
|
|
|
| |
| |
|
Ce qu'apporte un ingénieur expérimenté à chaque tâche, c'est la compréhension des détails de ces différentes méthodes de stockage des données. Que le système de fichiers soit le traitement au niveau de l'entreprise de millions de fichiers ou qu'il soit aussi simple qu'un système de fichiers FAT (table d'allocation de fichiers), les ingénieurs expérimentés en récupération comprennent les principes de l'organisation et du stockage des données.
Par exemple, dans le système de fichiers FAT, il existe de nombreuses structures qui définissent un volume et qui pointent vers des données. Si un seul octet change dans l'une de ces définitions, les données ne seront pas accessibles. Le système de répertoire est une autre structure clairement définie qui contient les noms des dossiers et fichiers. Si cette zone est endommagée ne serait-ce que légèrement, les noms ne correspondront pas aux données.
Les autres systèmes de fichiers, tels que Linux (EXT, XFS, JFS), Netware (traditionnel, NSS) et Windows (NTFS), sont uniques dans leur méthode d'organisation des données. Ces systèmes de fichiers robustes ne se contentent pas de simplement enregistrer le nom des fichiers, leur date de création et leur taille : ils documentent d'autres informations relatives aux fichiers.
L'expertise requise pour la récupération de données va plus loin que la seule exécution de logiciels automatisés. Il peut être difficile de trouver des ingénieurs disposant des connaissances nécessaires pour offrir des récupérations de qualité dans votre entreprise. C'est là que le recours à un service de récupération de données réputé est crucial. Ontrack a bien conscience que vos utilisateurs et vous êtes très occupés, et que le facteur temps est essentiel en cas de perte de données. Par conséquent, laissez la récupération à des ingénieurs en récupération expérimentés et aguerris qui comprennent comment les données sont stockées.
La récupération de données se divise en deux disciplines : les ingénieurs spécialisés en électromécanique qui travaillent en salle blanche, et les ingénieurs spécialisés dans la réparation des structures de système de fichiers qui travaillent en laboratoire. Ontrack a toujours tenu ces disciplines bien à part et a formé les ingénieurs pour qu'ils deviennent des experts dans leur propre domaine. Cette approche permet au personnel d'ingénierie de se concentrer pleinement sur les récupérations délicates. La récupération de données est une science. Grâce à l'investigation et l'observation approfondies, le développement de stratégies de récupération, le test de ces stratégies et la vérification des données, les résultats sont des récupérations de qualité.
Les utilitaires logiciels automatisés ont leur place dans la fourniture de solutions pour les situations de perte de données simples. Lors de l'utilisation de ces utilitaires, les fichiers doivent toujours être testés avant de dégager les données de l'utilisateur. Si la qualité des données récupérées n'est pas exploitable, il est dans le meilleur intérêt de l'utilisateur ou du client de faire appel à un service de récupération de données professionnel et expérimenté. Après tout, quels sont les objectifs d'une récupération de données digne de ce nom ? Retrouver les données du fichier d'origine.
Microsoft ® Scandisk for the Win 9.x/ME operating system
support.microsoft.com/default.aspx?scid=kb;en-us;186365
Microsoft ® CHKDSK for the Windows XP operating systems
www.microsoft.com/resources/documentation/Windows/XP/all/reskit/en-us/Default.asp?url=/resources/documentation/Windows/XP/all/reskit/en-us/prkd_tro_xudm.asp
Novell ® Netware VREPAIR
www.novell.com/documentation/oes/index.html?page=/documentation/oes/utlrfenu/data/htb2yt1x.html
Novell ® Netware NSS rebuild
www.novell.com/documentation/oes/utlrfenu/data/h4uk0rz1.html
Unix-Sun ® FSCK usage
docs.sun.com/app/docs/doc/816-0211/6m6nc66qt?a=view
Linux SuSE ® FSCK usage
support.novell.com/techcenter/articles/nc2005_08g.html
Linux RedHat ® FSCK usage
www.redhat.com/docs/manuals/linux/RHL-7-Manual/ref-guide/s1-sysadmin-rescue.html