Windows Server 2016 et la récupération de données

mardi 7 février 2017 par Ontrack France

Windows Server 2016 et la récupération de données (1/2)

Microsoft vient de publier sa nouvelle version finale de Windows Server 2016 il y a tout juste quelques semaines. Celle-ci se présente en trois déclinaisons :

  • Windows Server 2016 Standard pour les centres de données physiques (ou virtualisés au minimum),
  • Windows Server 2016 Datacenter pour les centres de données principalement virtualisés et les environnements cloud,
  • Windows Server 2016 Essentials pour les petites entreprises avec un maximum de 25 utilisateurs et 50 appareils.

D'autre part, deux éditions de Windows Storage Server 2016 – Workgroup et Standard – ont également été publiées. Ces éditions ne sont fournies qu’avec le matériel fabriquant. Microsoft assure qu’il s’agit de la base pour le futur et de nombreux experts affirment qu’il présente plusieurs avantages pouvant inciter les firmes à évoluer vers le nouveau système. Par exemple, Windows Server 2016 intègre de nouvelles couches de sécurités permettant de mieux détecter et combattre les menaces auxquelles la structure informatique peut faire face. Davantage de flexibilité et de stabilité est promise avec l’apport d’un environnement virtuel basé sur HyperV. Avec une nouvelle pile réseau, Windows Server 2016 offre une fonctionnalité de mise en réseau basique entièrement intégrée ainsi que l’architecture SDN de Microsoft Azure.

D’autre part, le nouveau système d’exploitation serveur est basé sur le concept de SDS (stockage défini par logiciel) qui possède l’avantage que la mémoire requise et les nouveaux besoins en stockage peuvent être facilement ajoutés à l’intérieur de la structure de serveur complète. La version 2016 offre différents outils pour la gestion dynamique de l’informatique, du réseau, du stockage et de la sécurité. Un dernier point mais non des moindres : Windows Server 2016 promet une meilleure tolérance aux pannes avec la nouvelle version. Microsoft l’assure : « Lorsque le matériel subit une défaillance, il vous suffit de le changer ; le logiciel récupère par lui-même, sans étapes de gestion compliquées ».

Donc lorsque le système d’exploitation serveur est si performant, pourquoi ne pas l’utiliser ? Avant tout, certains éléments doivent être considérés. Et parce que nous regardons d’un point de vue de la récupération des données sur tout système, il est important que nous nous penchions sur certaines nouvelles technologies qui pourraient avoir une incidence sur la perte des données ainsi que sur une récupération des données réussie par la suite : il s’agit du système de fichiers résilients (ReFS) dans sa nouvelle version 3 ainsi que du concept d’espaces de stockage direct – le successeur des espaces de stockage introduits pour la première fois dans Windows Server 2012. Mais commençons par le ReFS :

Système de fichiers ReFS : amélioration ou défi de taille ?

Avec la nouvelle version du système de fichiers de Microsoft – ReFS version 3 – un nouveau défi se présente dans Windows Server 2016, tant pour les utilisateurs que pour les experts en récupération des données : il existe peu d’experts dans le monde disposant des connaissances requises pour récupérer des données qui sont stockées à l’intérieur de ce nouveau système de fichiers. ReFS – ou système de fichiers résilients – est une technologie propriétaire, ce qui signifie que Microsoft n’a pas dévoilé les spécifications du ReFS et qu’un travail important d’ingénierie inverse doit être effectué, afin d’analyser le système de fichiers et créer les outils adéquats pour accéder de nouveau aux données se trouvant à l’intérieur.

Le ReFS a été introduit pour stocker de manière sécurisée les grandes quantités de données. N’oubliez pas qu’il s’agit d’un système de fichiers pour stocker des données, et non pour faire tourner le système d’exploitation. Il est par conséquent conçu pour être utilisé dans les systèmes avec de vastes ensembles de données, fournissant ainsi une bonne efficacité en matière d’évolutivité et de disponibilité en comparaison avec le NTFS (New Technology File System). L’intégrité des données était l’une des nouvelles caractéristiques ajoutées, permettant aux données critiques des entreprises d’être protégées des erreurs courantes pouvant causer une perte de données. Si une erreur système se produit, le ReFS peut récupérer de l’erreur sans risque de perte des données ainsi que sans affecter la disponibilité du volume. La dégradation des supports est également un autre problème qui avait été résolu afin de prévenir une perte des données lorsqu’un disque se détériore.

L’un des principaux avantages de l’utilisation de Windows Server 2016 avec le ReFS est que le système crée automatiquement des sommes de contrôle pour les métadonnées stockées sur un volume. Toute incohérence de la somme de contrôle entraîne une réparation automatique des métadonnées. Mais ce qui en fait véritablement une fonctionnalité exceptionnelle, c’est que les données de l’utilisateur peuvent également être sécurisées contre les défaillances en les associant aux sommes de contrôle. Si une somme de contrôle erronée est découverte, le fichier sera réparé. Cette fonction est appelée Flux d’Intégrité. Ce dispositif de sécurité peut être activé pour l’ensemble du volume, pour un dossier spécifique ou pour des fichiers individuels.

Microsoft affirme dans sa documentation en ligne que « lorsque le ReFS est utilisé en conjonction avec un espace miroir ou un espace de parité, une corruption détectée - aussi bien dans les métadonnées que dans les données de l’utilisateur, lorsque les flux d’intégrité sont activés - peut être réparée automatiquement à l’aide de l’autre copie fournie par les espaces de stockage ». Et d'ajouter : « avec le ReFS, si une corruption se produit, le processus de réparation est à la fois limité à la zone de corruption et effectué en ligne, ne nécessitant donc aucun arrêt des volume. Bien que ceci soit rare, si un volume devient corrompu ou que vous choisissez de ne pas l’utiliser avec un espace miroir ou un espace de parité, le ReFS exécute salvage, une fonctionnalité qui supprime les données corrompues de l’espace de nommage d’un volume actif et assure que les données correctes n’ont pas été affectées de façon négative par les données corrompues non réparables ». Ce qui signifie que Microsoft a intégré des fonctionnalités d’auto-récupération des données et fichiers corrompus.

Comme nous l’avons déjà souligné dans notre article détaillé sur le système de fichier ReFS, la structure qu’il utilise fonctionne comme une base de données, elle est donc complètement différente d’une récupération NTFS qui utilise une table fixe de métadonnées. Pour trouver les données, les experts en récupération de données doivent traverser le ReFS comme une base de données, en ouvrant des tables qui contiennent un autre ensemble de tables, et ainsi de suite.

Un autre problème pouvant être assez difficile en ce qui concerne la récupération des données est lié aux nouvelles tailles des fichiers et volumes ReFS. Un simple fichier sur un volume peut atteindre la taille de 16 exabytes (qui équivalent à 16 millions de terabytes !!) et un volume ReFS peut atteindre la taille d’un Yottabyte (qui équivaut à un milliard de terabytes). En considérant ceci, il devient très clair que cet espace de stockage énorme représente également le danger de cette technologie d’un point de vue de la récupération des données. Imaginez un simple fichier d’une taille de 16 millions de terabytes se retrouvant corrompu et que vous êtes supposé récupérer, ou encore que le système de fichiers complet soit défectueux avec des tonnes de ces larges volumes inclus, il apparaît alors évident que la récupération des données sera non seulement compliquée, mais qu’elle prendra par ailleurs un temps fou.

À présent que nous avons expliqué l’impact du ReFS sur la structure des données dans Windows Server et la récupération de données, nous souhaitons à présent nous pencher sur une autre technologie qui a une profonde incidence sur la récupération de données en cas de perte : les espaces de stockage et Storage Spaces Direct :

Storage Spaces Direct, la réponse de Microsoft à VMWare vSAN

Les Storage Spaces Direct sont l’évolution de sa technologie d’espaces de stockage introduite dans son précédent système d’exploitation serveur – Windows Server 2012. En bref, les espaces de stockage impliquent que toutes les données soient stockées dans un agrégat virtuel de disques physiques basé sur des disques durs ou SSD physiques. L’avantage de ce concept est qu’il est facile d’ajouter de nouveaux disques à l’agrégat virtuel sans ajustements ni problèmes insurmontables.

Avec les Storage Spaces Direct – qui ne sont disponibles que dans l’édition Windows Server 2016 Datacenter – le concept est amené vers un niveau supérieur : il est à présent possible d’associer les volumes locaux de différents serveurs dans un groupe en un bassin unifié (plutôt que simplement tous les lecteurs physiques d’un serveur en un bassin de données). Maintenant – par opposition avec l’ancienne version, qui était uniquement capable d’utiliser SAS-JBODs – il est possible d’utiliser différents disques durs ou lecteurs flash – SATA, SAS ou SSD. Tous ces stockages – à l’exception des disques qui sont reliés à l’aide de la fonction « multipath » – peuvent à présent être utilisés pour créer un agrégat de stockage unique. D’autre part, Microsoft intègre le bus de stockage des logiciels, lequel – pour faire simple – remplace les anciens câbles Fibre Channel, intègre la mise en réseau entre plusieurs serveurs, et établit avec ceci une structure de stockage défini par logiciel où tous les serveurs peuvent voir l’ensemble des lecteurs connectés.

Le concept de redondance des espaces de stockage est comparable au concept du RAID (mais la technologie utilisée est différente et basée sur le logiciel). Au cours de la configuration, il est possible de choisir entre un agencement de stockage simple, miroir, ou de parité. L’agencement simple implique qu’il n’y a aucune redondance, l’agencement miroir reproduit simplement le(s) disque(s) (lorsque deux disques sont disponibles, un des disques peut être défectueux, lorsque trois disques sont disponibles, deux des disques peuvent être défectueux). Enfin, l’agencement de parité est basé sur le RAID5 et nécessite trois disques dans un bassin de stockage afin de prévenir la perte des données.

Outre cette nouvelle technologie intégrée dans Windows Server 2016, il est possible de mettre en œuvre une solution de stockage convergent (stockage et calculs sont placés dans des groupes différents) ainsi qu’une solution d’hyper-convergence (un même groupe pour le stockage et les calculs). Il s’agit de la principale différence entre VMware vSAN et Windows Server 2016 : Microsoft permet également à ses utilisateurs de créer leurs propres niveaux de stockage, parce que les espaces de stockage direct ne sont pas fusionnés avec l’hyperviseur.

Que l’on déploie une solution de convergence ou d’hyper-convergence avec Windows Server 2016, Microsoft assure qu’avec sa nouvelle version renforcée des espaces de stockage, les données stockées à l’intérieur du bassin sont plus sécurisées que jamais. « Les espaces de stockage protègent les données des défaillances partielles et totales des disques en conservant des copies sur plusieurs disques. Le ReFS se connecte avec les espaces de stockage afin de réparer automatiquement la corruption. » indique Microsoft.

Une bonne chose pour la récupération de données ?

Bien que Microsoft affirme que Windows Server 2016 est la base pour le futur de la technologie de serveur et ait intégré de nombreuses fonctionnalités intéressantes et utiles (néanmoins complexes), celui-ci peut également présenter une menace pour la réussite d’une récupération des données. Avec l’association de deux technologies avancées telles que le ReFS et les Storage Spaces Direct, qui sont en réalité le stockage convergent (et hyper-convergent) de Microsoft et une solution basée sur logiciel qui s’appuie sur la virtualisation HyperV et les machines virtuelles, la récupération de données devient une tâche plus complexe présentant un défi de taille.

Pensez simplement à un scénario de récupération des données dans lequel de nombreux problèmes surviennent en même temps, par exemple plusieurs disques sont défectueux au même moment (ce qui n’est pas si improbable, sachant qu’ils ont été achetés et installés en même temps), une panne de secteur se produit et votre alimentation sans coupure (UPS) tombe en panne, pour quelque raison que ce soit, ce qui entraîne un arrêt du système inapproprié pouvant causer un plantage du système complet avec pour résultat une perte des données importante.

Bien que les professionnels de la récupération des données tels que Ontrack soient déjà parvenus à récupérer avec succès les données de systèmes de stockage multicouches ou de serveurs tels que VMware vSAN ou HP EVA 6000 et aient développé des outils pour reconstituer le système ainsi que les structures de données, ceci est plus difficile, demande beaucoup de temps et présente un coût exorbitant.

Donc lorsque vous utilisez Windows Server 2016, essayez de faire en sorte que votre conception des systèmes soit la plus simple possible, abstenez-vous d’utiliser trop de fonctionnalités ensembles (même lorsqu’elles sont disponibles, comme par exemple la déduplication, la virtualisation et la compression des données, le tout dans un même système), d’autre part enregistrez et conservez tout ce qui concerne le système en vue d’une consultation future en cas d’urgence – qu’il s’agisse d’une perte de données, d’une défaillance de l’ensemble du système, ou les deux. Vous en serez reconnaissant envers vous-même !

Technicien Ontrack

Vous avez perdu des données ? Demandez une évaluation gratuite de votre support de stockage :
0 800 10 12 13 Evaluation gratuite