Go to Top

Solutions de récupération pour les grands systèmes de stockage (Partie 1)

Les systèmes de stockage sont devenus un domaine informatique unique et complexe, et peuvent avoir différentes significations selon les personnes. Aussi, comment pouvons-nous définir ces systèmes ? Les systèmes de stockage sont le hardware qui stocke les données.

Par exemple, il peut s’agir du serveur d’une petite entreprise avec un bureau de dix utilisateurs ou moins. Le système de stockage serait alors composé des disques durs à l’intérieur de ce serveur, où se trouvent les informations des utilisateurs. Dans un contexte d’entreprise de grande taille, les systèmes de stockage peuvent être de grandes armoires SAN contenant les disques durs et dont l’espace a été partagé en tranches et en cases de différentes manières afin d’assurer la redondance et la performance.

La technologie des systèmes de stockage en constante évolution

Aujourd’hui, la technologie de stockage englobe toutes sortes de supports de stockage. Parmi ceux-ci peuvent se trouver les systèmes Write Once Read Many – écriture unique, lecture multiple (WORM), les systèmes de bibliothèques de bandes ou bandothèques et les systèmes de bibliothèques de bandes virtuelles. Au cours des dernières années, les systèmes SAN et NAS ont apporté une fiabilité remarquable. Quelle est la différence entre les deux systèmes ?

  • Les unités SAN (réseau de stockage) peuvent être d’imposantes armoires contenant parfois jusqu’à 240 disques durs ! Ces vastes systèmes de stockage de 50 Terabytes et plus font plus qu’alimenter des centaines de disques. Ces systèmes sont des entrepôts de données incroyablement puissants dotés de logiciels utilitaires polyvalents qui gèrent plusieurs réseaux, diverses configurations d’architectures de stockage, et fournissent une surveillance permanente du système
  • Les unités NAS (stockage en réseau) sont des unités autonomes possédant leur propre système d’exploitation, système de fichiers, et qui gèrent les disques durs reliés. Ces unités se présentent sous diverses formes et de différentes tailles pour répondre à la plupart des besoins, et opèrent en tant que serveurs de fichiers

Pendant une certaine période, les systèmes de stockage à grande échelle n’étaient pas accessibles aux petites entreprises. Les systèmes SAN basés sur des disques durs Serial ATA (SATA) se sont présentés comme un moyen rentable de fournir des espaces de stockage à grande capacité. Ces unités de réseau offrent également des systèmes de sauvegarde via des bibliothèques de bandes virtuelles, littéralement, des matrices RAID qui se présentent comme des appareils d’enregistrement de bandes magnétiques permettant de supprimer complètement le support de stockage sur bandes.

Les autres technologies de stockage telles qu’iSCSI, DAS (stockage à connexion directe)stockage de proximité (données qui sont reliées à un support amovible), et CAS (stockage de contenu adressable) sont toutes des méthodes permettant d’avoir une disponibilité des données. Les architectes en stockage de données savent que le fait de disposer d’une simple sauvegarde n’est pas suffisant.

L’obsolescence rapide

À l’heure actuelle, dans les contextes informationnels intense, les sauvegardes, qu’elles soient incrémentielles et programmées chaque soir ou hebdomadaires et complètes, sont obsolètes en quelques heures, voire dans les quelques minutes qui suivent leur création.

Dans les grands entrepôts de données, sauvegarder des données qui évoluent en permanence n’est pas envisageable. La seule solution pour ces énormes structures est de disposer de systèmes de stockage en miroirs, c’est à dire des serveurs identiques avec exactement le même espace de stockage.

3 choses à considérer dans le choix d’un système

Une analyse minutieuse de l’environnement opérationnel est nécessaire. La plupart diraient que n’avoir absolument aucune défaillance est le meilleur environnement, ce qui est vrai pour les utilisateurs et les administrateurs. La dure réalité est que les désastres liés à la perte de données se produisent chaque jour malgré la mise en œuvre de politiques et de programmes d’atténuation des risques.

Lors de l’examen de vos besoins en matière de stockage, prenez en compte :

  • Quel est le délai de récupération ? Quelle est la période de temps maximum dont dispose votre client avant que les données ne soient disponibles de nouveau ? En d’autres termes, combien de temps vous ou votre client pouvez survivre sans les données ? Ceci permettra d’établir les exigences de performance de l’équipement
  • La qualité des données récupérées La récupération des données originales est-elle requise ou d’anciennes données sauvegardées seront-elles suffisantes ? Ceci concerne le schéma de sauvegarde qui est utilisé. Si les données sur votre système de stockage évoluent rapidement, les données originales seront les plus utiles
  • Quelle quantité de donnés vous ou votre client archivez-vous ? La récupération de quantités importantes de données prendra du temps à transiter au travers d’un réseau. Dans les configurations DAS (stockage à connexion directe), le temps de récupération dépendra de l’équipement ainsi que de la performance I/O du matériel

Schémas de protection des données uniques

Les fabricants de systèmes de stockage recherchent des moyens uniques de traiter des quantités importantes de données tout en continuant à être en mesure d’assurer une redondance en cas de désastre.

Certaines unités SAN de grande taille intègrent une organisation complexe des appareils au niveau des blocs, créant essentiellement un système de fichiers à faible volume à partir de la perspective RAID. D’autres unités SAN sont dotées d’un système interne de journalisation des transactions au niveau des blocs afin que le processeur de contrôle de l’unité SAN effectue un suivi de toutes les écritures au niveau des blocs vers les disques individuels. À l’aide de cette journalisation des transactions, l’unité SAN peut récupérer des pannes de secteur ou des coupures inattendues.

Comment la récupérabilité peut-elle être améliorée ?

Certains informaticiens spécialisés dans le domaine des systèmes de stockage proposent d’ajouter davantage d’intelligence à la carte de contrôle de la matrice RAID afin qu’elle soit « sensibilisée aux systèmes de fichiers ». Cette technologie assurerait davantage de récupérabilité en cas de catastrophe, l’objectif étant de donner au réseau de stockage plus de capacités d’auto-guérison.

D’autres idées allant dans ce sens proposent d’avoir une réserve de stockage par laquelle plusieurs ordinateurs peuvent accéder aux informations sans être dépendant du système de fichiers d’un système en particulier. Dans les organisations où se trouvent plusieurs plateformes hardware et systèmes, un système de fichiers transparent assurera un accès aux données indépendamment du système ayant écrit les données.

D’autres informaticiens ont une approche très différente quant à la redondance du réseau de stockage. Le concept RAID est utilisé sur un grand nombre de systèmes, toutefois les informaticiens et les ingénieurs cherchent de nouveaux moyens d’assurer une meilleure protection des données en cas de défaillance. Les objectifs qui motivent ce type de développement RAID sont la protection et la redondance des données sans sacrifier la performance.

 

Avec ces informations sur les technologies utilisées au sein des architectures des systèmes de stockage, nous arrivons au terme de la première partie de cet article. La semaine prochaine, nous aborderons la question de la prévention des défaillances système ainsi que les mesures à prendre lorsque l’on est frappé par une perte de données. Alors à bientôt…

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *