Un cabinet comptable lyonnais de 38 collaborateurs nous contacte un vendredi après-midi : leur serveur principal, un Dell PowerEdge équipé d'une grappe RAID 5 de six disques de 4 To, ne démarre plus. La veille au soir, une coupure de courant suivie d'une surtension a frappé le local technique. Au redémarrage, le contrôleur PERC H730 affiche trois disques en état « Foreign » et refuse de monter le volume. Toute la comptabilité — 22 To de données clients, écritures et archives — est inaccessible. En pleine période de clôture, chaque jour d'arrêt se chiffre en milliers d'euros.
Le contexte : pourquoi 3 disques « Foreign » est un piège
Un RAID 5 tolère la perte d'un seul disque : la parité répartie permet alors de reconstruire les données manquantes. Avec trois disques signalés défaillants, le réflexe naturel — relancer une reconstruction automatique depuis le contrôleur — aurait été catastrophique : il aurait écrasé les métadonnées des disques encore sains et rendu la récupération impossible. C'est l'erreur n°1 sur un RAID dégradé.
Notre première instruction au téléphone a donc été sans ambiguïté : éteindre le serveur et ne rien relancer. Le serveur nous a été acheminé le soir même. L'analyse du diagnostic gratuit a révélé que les trois disques n'étaient pas réellement morts : la surtension avait corrompu l'électronique de deux d'entre eux et déréglé les métadonnées de configuration du troisième. Les plateaux étaient intacts — le pronostic devenait favorable.
L'intervention, étape par étape
1 · Réparation électronique minimale
Deux disques nécessitaient une remise en route avant toute lecture. Nous avons remplacé leur carte électronique (PCB) avec transfert de la ROM d'origine — indispensable, car cette mémoire contient les paramètres adaptatifs propres à chaque disque. Sans ce transfert, un disque « réparé » ne produit que des données illisibles.
2 · Clonage forensique des 6 disques
Chaque disque membre a ensuite été cloné secteur par secteur vers une image, à l'aide d'imageurs matériels et de bloqueurs d'écriture. À partir de cet instant, plus aucune opération n'a touché les disques physiques : tout le travail s'est fait sur les copies. Les zones difficiles ont été lues en priorité sur les secteurs sains, puis retentées en plusieurs passes pour les secteurs récalcitrants.
3 · Reconstruction virtuelle de l'array
Le cœur de l'intervention. Sans se fier au contrôleur défaillant, nous avons déterminé manuellement les paramètres réels de la grappe par analyse de l'entropie des données : taille de bande (stripe size), ordre exact des disques, schéma de rotation de la parité et décalage initial (offset). La parité d'un RAID 5 se calcule par opération XOR entre les blocs de données ; en remontant ce calcul, on reconstruit virtuellement le bloc manquant de n'importe quel disque, sans avoir besoin du disque physique correspondant.
4 · Extraction du système de fichiers
Une fois le volume reconstruit virtuellement, nous avons monté le système de fichiers en lecture seule et vérifié l'intégrité des bases comptables et des archives. La liste VeriFiles — l'inventaire complet des fichiers récupérables — a été transmise au client pour validation avant toute facturation.
Le résultat
La totalité des 22 To a été récupérée et restituée sur un support neuf chiffré. Le cabinet a repris son activité en moins de 48 heures après réception du serveur — clôture comptable préservée. Forfait : 2 700 € HT (700 € HT par disque membre traité), facturé uniquement après validation de la liste de fichiers.
Ce cas illustre trois principes qui guident chaque intervention RAID chez Dafotec : ne jamais travailler sur les disques d'origine, ne jamais relancer une reconstruction automatique avant diagnostic, et comprendre que la donnée survit presque toujours à la défaillance du contrôleur. La difficulté n'est pas de « réparer » des disques, mais de reconstituer la logique de l'array.
