La récupération d'emails : problèmes & solutions

Comme tout autre type de données informatiques, les emails ne sont pas l’abri de sinistres. Si les dangers sont bien connus, les solutions de récupération le sont beaucoup moins.

Dans cet article, Kroll Ontrack abordera les différents types de stockage de courriels et les principales pannes à l’origine de pertes de courriels. Puis nous discuterons des techniques employées par les prestataires spécialisées selon le type de perte.

Par mesure de clarté, nous différencierons ici les récupérations sur les fichiers hébergés en local sur la machine de l’utilisateur des récupérations effectuées directement depuis le serveur Exchange.

Stockage des courriels au niveau local : description et récupération

  • Dossier de stockage Outlook Personal Folder Store (.PST) : les fichiers .PST font partie de Microsoft Outlook. Outlook constitue l’interface de la boite aux lettres de l’utilisateur avec Exchange. Outlook fournit et stocke les courriels depuis les fichiers PST. Ces fichiers, très robustes sont conçus pour contenir d’autres éléments que juste des courriels. Cela conduit les utilisateurs à y stocker de nombreux types de documents, sans tenir compte du vieil adage “Ne pas mettre tous ses œufs dans le même panier”. Les fichiers PST peuvent se corrompre, devenir inaccessibles à cause d’une panne du disque dur ou être accidentellement effacés. De plus, les PST ont une taille maximale limitée à 2 Go. L’utilisation de PST comme fichier de stockage comprend donc de nombreux risques. Kroll Ontrack a développé des techniques propriétaires permettant de contourner ce problème sans perte massive de courriels.

  • Dossier de stockage hors ligne Outlook (.OST) : les dossiers de stockage hors ligne (fichiers .OST) font partie de Microsoft Outlook et fournissent une méthode de synchronisation entre le serveur Exchange et un compte de messagerie existant. Les fichiers OST, comme les fichiers PST résident sur la machine de l’utilisateur. Cependant, ce fichier est constamment synchronisé avec le compte de messagerie. Cela signifie que les données sont dupliquées sur le serveur et sur la machine de l’utilisateur. Les changements hors ligne sont synchronisés lorsque la communication avec le serveur Exchange est rétablie.

    Les fichiers OST sont des solutions idéales pour les utilisateurs d’appareils mobiles et peuvent être configurés pour contenir des dossiers spécifiques. Cependant, les fichiers OST, tout comme les PST, peuvent se corrompre et sont limités à 2 Go. L’accès au fichier OST nécessite un compte de messagerie Exchange, et si ce compte est manquant ou a été supprimé, le fichier OST ne pourra pas s’ouvrir. Tout comme pour les PST, les ingénieurs Ontrack Récupération de Données ont développé des techniques propriétaires pour récupérer des données dans ces conditions.

  • Outlook Express Message Stores : pour les utilisateurs d’Outlook Express, Microsoft utilise un type de stockage différent. Outlook Express est recommandé pour les comptes de messagerie POP3 et les comptes de messagerie Internet (Hotmail, Yahoo!…). Outlook Express gère les courriers électroniques mais sans toutes les fonctionnalités de Outlook.

    Outlook Express utilise des fichiers DBX pour représenter les dossiers qui apparaissent dans l’interface du client de messagerie. Les .DBX ont leur propre système de fichiers DX pour retrouver courriels et pièces jointes. A l’instar des PST et OST, les DBX peuvent être corrompus et là aussi Kroll Ontrack a des techniques uniques permettant de contourner ces problèmes afin de récupérer des fichiers Outlook Express.

Scénarios de pertes de courriels

Kroll Ontrack répond tous les jours à des situations très diverses. Comme pour toute autre perte de données, l’utilisateur est à la recherche de la version originale et non d’une sauvegarde. Les courriels font partie des fichiers les plus demandés par nos clients. La liste ci-dessous récapitule les causes les fréquentes de pertes de courriels et éléments de messagerie

  • Effacement : effacement du conteneur (PST, OST, DBX) ou de l’un de leurs objets (dossiers ou emails).
  • Réécriture : réécriture du fichier contenant les messages. Les objets contenus peuvent être réécris par une importation ou en déplaçant manuellement des messages portant le même nom.
  • Réinstallation du système d’exploitation : une cause classique de perte est l’installation du système d’exploitation. Dans le cas de Windows, l’Explorateur fait partie intégrante du système. Outlook Express dépend de lui pour définir la location des fichiers systèmes. Une réinstallation peut réécrire les Profiles contenant les locations de ces fichiers. Windows XP a une protection empêchant une seconde installation avec un nom d’utilisateur identique, tant que le volume n’est pas reformaté. Ainsi, le profil de l’utilisateur dans les Documents et Paramètres n’est pas perdu.
  • Corruption interne : les fichiers contenant des messages ont des structures complexes. Une erreur d’applicatif peut inscrire des données incorrectes dans le fichier. Cette corruption ne permettra pas au client d’accéder correctement aux données.
  • Fichier système tronqué: la corruption peut se passer au niveau du fichier système. Ces fichiers peuvent présenter des défauts qui empêchent de pouvoir y accéder. L’outil de réparation du système d’exploitation est souvent à l’origine d’erreur de volume. La fonction de ces outils est de rendre le volume prêt à l’écriture et lecture de données. Ceci se fait parfois au détriment des données détruites pendant la réparation. .S’il y a des erreurs, l’outil de réparation réduira le fichier. Cette manipulation peut supprimer de larges sections du fichier, le rendant totalement inaccessible.

La solution Ontrack aux pertes de PST, OST, DBX

Comme expliqué précédemment, PST, OST et DBX contiennent souvent de nombreux documents : ces données sont souvent indispensables au fonctionnement d’une entreprise ou de toute organisation. Pour ces raisons, Ontrack s’attache à récupérer non seulement les fichiers conteneurs, mais également à réparer l’ensemble de tous les documents contenus dans chacun de ces conteneurs, afin que les données initiales soient de nouveau accessibles.

Les outils développés par Ontrack répondent à 3 exigences :
  1. Retrouver les données,
  2. Construire une structure virtuelle à l’intérieure de la mémoire pour localiser les données,
  3. Extraire les messages.

Dans ses laboratoires français situés en région parisienne, Kroll Ontrack dispose d’outils pour les fichiers Outlook PST/OST et les fichiers Outlook Express. Ces outils de réparation vont jusqu’à travailler sur les messages et dossiers supprimés. Une fois les données supprimées, le système marque cet espace comme libre. Les outils Ontrack retrouvent les morceaux du message et les rassemblent.

Kroll Ontrack propose également EasyRecovery EmailRepair, solution logicielle, qui incorpore les mêmes fonctions de récupération que celles utilisées dans nos laboratoires.

EasyRecovery Email Express pour Outlook dispose d’un moteur capable de trouver les messages endommagés à l’intérieur d’un fichier DBX. Le logiciel est conçu pour scanner rapidement à travers les fichiers et définir quels messages sont endommagés. Il extrait ensuite les données dans un format natif DBX, ce qui facilite la réimportation des données dans Outlook Express.

Récupération de courriels au niveau du serveur Microsoft Exchange

Microsoft Exchange Server (Exchange ci-après) est une application utilisée en entreprise dont la fonction est de gérer l’ensemble des messages entrants et sortants. Le fonctionnement d’Exchange est extrêmement complexe notamment dû aux nombreux algorithmes et aux bases de données relationnels utilisées pour le stockage des informations.

Les 4 étapes du fonctionnement du serveur Exchange :
  1. Le client se connecte au serveur et envoie le message,
  2. Le serveur détermine la location du message dans la base de données,
  3. Le serveur notifie le destinataire de l’arrivée du message,
  4. Le client destinataire se connecte au serveur pour récupérer le message.
Différents composants participent à cette chaine :
  • Banque d’information : gère l’accès aux bases de données pour les messages et le contenu des dossiers publics.
  • System Attendant : surveillance des liens, création des adresses emails des destinataires, génération de tables de routage.
  • Simple Mail Transfer Protocol (SMTP) : fonctions de routage pour la livraison des messages entre les serveurs.
  • Active Directory™ : maintenance des informations décrivant l’organisation, les utilisateurs, les serveurs et les listes de distribution. Une organisation est un ensemble de serveurs fonctionnant sur Exchange 2000.

Ces composants principaux sont aidés par bien d’autres dans la gestion, l’organisation, la distribution et la réception de messages.

L’Information Store (ou banque d’information) est l’endroit où résident les boites aux lettres. Le service de banque d’information est partagé entre 2 processus. Le premier gère l’organisation du stockage des messages. C’est la partie logique de l’organisation des messages. Le second processus est l’Extensible Storage Engine (ESE). Celui-ci gère la structure interne de la base de données. L’ESE manipule les requêtes depuis le premier processus et écrit les données du message dans le fichier.

Détails sur la banque d’information et la corruption

La banque d’information est au cœur du système et est composé des fichiers de la base de données. Dans les versions précédentes d’Exchange, 2 fichiers composaient la banque d’information : "priv.edb" contenait les boites aux lettres des utilisateurs et le fichier "pub.edb" contenait les fichiers publics. Les fichiers EDB sont des fichiers au format rich text contenant les bases de données. C’est ce fichier que gère l’Extensible Storage Engine.

Exchange 2000/2003 ajoute de nouveaux fichiers à la banque d’information, les fichiers STM. Ce fichier contient tous les messages reçus depuis l’extérieur de l’organisation. Les messages passent au fur et à mesure à l’intérieur du fichier. Les références à ces messages et leurs destinataires sont conservés dans un fichier .EDB. Ces fichiers collaborent pour enregistrer les messages.

En interne, les fichiers EDB sont complexes. Basés sur une base de données relationnelle, ils impliquent la mise en relation de nombreux tableaux et index servent à la gestion et mise à jour de l’Extensible Storage Engine. Cette architecture est ainsi faite pour pouvoir gérer des transactions multiples et entrelacées.

Le serveur Exchange contient des méthodes basées sur les transactions et d’enregistrement anticipés afin de fournir des mises à jour complètes et vérifiées à la banque d’information. Ces types de transaction sont appelés ACID (pour Atomicité, Consistance, Isolation, Durabilité).

  • Atomicité : Une transaction devrait être totalement réalisée ou totalement annulée. En cas de panne, toutes les opérations et procédures devraient être annulées, et toutes les données retournées dans leur état précédent.
  • Consistance (uniformité) : Une transaction transforme un système d’un état uniforme vers un autre état uniforme.
  • Isolation : Chaque transaction doit se réaliser indépendamment des autres transactions se déroulant simultanément.
  • Durabilité : Les transactions complétées doivent rester permanentes, même en cas de panne de système.
Exchange utilise des fichiers d’enregistrement pour compléter ce processus. Tous les messages entrant et sortant du serveur suivront cette chaine :
  1. Message sauvegardé en mémoire
  2. Message écrit dans les fichiers log
  3. Message dédié à la banque d’information du fichier log

En cas de panne, les serveurs Exchange exécuteront une récupération “allégée” au redémarrage. Les fichiers log sont vérifiés par rapport au contenu réel de la base de données. Si un message venait à être effacé d’une boite aux lettres, mais que les transactions ne soient pas terminées selon les fichiers du log, alors Exchange relancera la transaction et mettra à jour la base de données.

Même avec ces protections, la banque d’information peut se corrompre en interne. Les fichiers log peuvent devenir corrompus ou les mauvais fichiers peuvent être utilisés pendant la restauration d’un serveur. Quel que soit le cas, la banque d’information court le risque d’être endommagé. Il existe des utilitaires de restauration fournis avec le serveur Exchange. Le but de ces outils est de rendre la base de données prête pour les transactions. Parfois pendant le processus de réparation, des messages ou pièces peuvent se perdre. Le modèle de récupération utilisé par Ontrack est différent : nos outils vont en profondeur à travers le fichier et trouve les données. Ce modèle livre des résultats excellents et ne modifie pas le fonctionnement interne de la base de données.

Les solutions d'Ontrack pour récupérer des emails

Chez Ontrack, nous disposons de plus de 200 ingénieurs dont la seule préoccupation est de développer les outils les plus performants. Ainsi, nous avons mis au point toute une palette d’outils propriétaires pour la récupération de données Exchange. Notre but est de pouvoir récupérer le plus de données possibles. Le diagnostic d’une situation de récupération sur serveur Exchange peut prendre plusieurs heures, du à la complexité interne du fichier.

Le service le plus rapide pour ce genre de situation est notre service de récupération à distance. Il peut être déployé dans la plupart des configurations réseaux. Une fois le diagnostic complété Grace à ce service, le client n’a pas besoin de démonter et expédier leurs serveurs en laboratoire, minimisant couts et risques, et réduisant le temps d’indisponibilité... Une fois le diagnostic effectué et l’accord du client de reçu, les boites aux lettres seront récupérées sous format PST. Il suffit alors d’utiliser Exmerge pour les réimporter sur le serveur Exchange live de production.