Go to Top

MTBF : Peut-il vous aider à prévoir la panne d’un disque dur ?

Ici, chez Kroll Ontrack, nous savons bien qu’une perte de données peut affecter tout le monde.  Pour beaucoup d’entre nous, cela s’apparente à la panne d’un lecteur de disque dur (HDD) – un terme général pour parler des défauts mécaniques et électroniques qui rendent les informations stockées à l’intérieur illisibles. Les causes liées à ce type de mauvais fonctionnement sont nombreuses et vont des erreurs logicielles logiques aux dégâts physiques, en passant par la surchauffe – et, bien sûr, le fait que tous les appareils de stockage ont une durée de vie limitée.

Vous connaissez peut-être déjà certains signes indiquant qu’un lecteur de disque dur est près de la fin. Des bruits étranges, par exemple : si votre lecteur de disque dur passe du vrombissement et du cliquetis au grincement, il y a fort à parier qu’il vit ses derniers instants. En outre, des temps d’accès lents, des arrêts impromptus fréquents et un comportement anormal – comme des données corrompues ou des fichiers qui disparaissent – sont des indicateurs fiables qu’un lecteur de disque dur va tomber en panne.

Malheureusement, il ne s’agit pas vraiment de ce qu’on pourrait appeler des indicateurs scientifiques permettant de détecter une défaillance du lecteur de disque dur. C’est une chose d’écouter les sons bizarres qui émanent de votre ordinateur ou de votre tour, mais c’en est une autre d’appliquer la même méthodologie à un environnement RAID dans un centre de données.

Alors comment les consommateurs et les utilisateurs en entreprise peuvent-ils prévoir la panne imminente de leurs disques durs ? Ils peuvent déjà commencer par se renseigner sur les estimations des fabricants concernant les durées de vie de leurs appareils de stockage, souvent fournies sous la forme d’un indice de temps moyen entre pannes (MTBF).

Cependant, aussi ordinaire que soit ce repère, il est important de garder à l’esprit que les indications fournies pourraient ne pas être aussi transparentes et rassurantes qu’il n’y paraît.

Qu’est-ce que le temps moyen entre pannes ?

En théorie, un temps moyen entre pannes correspond assez bien à ce que son nom indique – la période moyenne entre une panne intrinsèque et la suivante pendant la durée de vie d’un seul composant. Ainsi, si un appareil ou une partie de celui-ci tombe en panne et est ensuite réparé(e), le chiffre correspondant au temps moyen entre pannes est le nombre d’heures pendant lesquelles on peut s’attendre à ce que l’appareil fonctionne normalement avant qu’il ne tombe à nouveau en panne.

Concernant les disques durs destinées aux particuliers, il n’est pas inhabituel de voir des temps moyens entre pannes d’environ 300 000 heures. Cela équivaut à 12 500 jours ou un peu plus de 34 ans. En attendant, des lecteurs de disques durs conçus pour une utilisation en entreprise promettent des temps moyens entre pannes pouvant s’élever jusqu’à 1,5 millions d’heures, ce qui équivaut à 175 ans. Impressionnant !

Il est évident que ces chiffres sont trompeurs, et qu’ils sont bien loin des attentes réelles quant à la longévité et à la fiabilité d’un lecteur de disque dur. Ce n’est pas parce qu’il y a un problème avec les méthodes de mesure du temps moyen entre pannes en soi – loin d’être une simple tendance, son histoire au sein de l’ingénierie militaire et aérospatiale est longue et importante.  Mais en réalité, aucun fabricant de disque dur ne teste ses lecteurs de disques durs d’entreprise depuis la moitié du 18ème siècle – à la place, les chiffres sont dérivés de taux d’erreurs sur un nombre de lecteurs statistiquement pertinents qui fonctionnent pendant des semaines ou des mois, et non de la durée de vie moyenne des appareils sur le terrain.

Proportionnellement, des études ont démontré que les temps moyens entre pannes promettent typiquement un taux de pannes beaucoup moins important qu’il ne l’est en réalité. En 2007, des chercheurs à Carnegie Mellon University ont examiné un échantillon de 100 000 lecteurs de disques durs (PDF, 272 Ko) avec des temps moyens entre pannes fournis par les fabricants variant d’un million à 1,5 million d’heures. Ceci se traduit en un taux de pannes annuel de 0,88 pour cent, mais leur étude a démontré que les taux de pannes annuels dans le secteur « dépassent habituellement un pour cent, s’élèvent fréquemment entre deux et quatre pour cent et peuvent aller jusqu’à 13 pour cent pour certains systèmes ».

Des recherches contemporaines effectuées par Google (PDF, 242 Ko) ont donné des résultats similaires : d’un échantillon de 100 000 lecteurs de disques durs avec un temps moyen entre pannes de 300 000 heures (un taux de pannes de 2,92%), le taux de pannes réel a atteint 8.6% durant la troisième année d’utilisation.

Veuillez noter que les fabricants ne ferment heureusement pas les yeux face à cette différence. Par exemple, Seagate et Western Digital ont tous les deux mis un terme à l’utilisation de ces indicateurs pour leurs lecteurs ces dernières années.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *