Vous êtes dans : Accueil > Actualités > E-Santé >

Vous faisiez des sauvegardes ? Eh bien, restaurez maintenant !

DSIH, Olivier Tourchon, MARDI 23 JANVIER 2024

Panique à la rédaction. Annie, la toujours coupable, a accidentellement supprimé toutes les archives des 18 derniers numéros.

Rien, nada. Elle a vidé sa corbeille, redémarré son PC et a même essayé des solutions de récupération de fichiers supprimés – il y en a tant qui promettent tant de choses dans le monde des freewares –, la gentille Annie.

Elle est partie le soir, sans rien dire à personne, en catimini. Ce n’est que le lendemain après-midi, alors que je voulais retrouver un vieil article que, m’exclamant « Diantre, où est le numéro de mai ? » (oui, nous utilisons un verbe soutenu au sein de la rédaction), Annie, de sa petite voix fluette et devenue enfantine, nous a dit : « Je crois que je les ai supprimés. »

Premier réflexe, la corbeille de son PC de bureau, évidemment, vous en connaissez le contenu. Second réflexe, le serveur de fichiers, on ne sait jamais. Pas plus de fichier de mai que d’avril ou de juin.

Dernier réflexe, on appelle le TAM de chez X qui nous fournit notre baie de stockage, et on lui explique. Il nous parle de snapshots, de rétention et de restauration.

Ben oui, comme toute bonne boîte qui a de l’informatique, nous faisons des sauvegardes. Sauvegarder coule même de source : nos archives sont notre trésor.

Sauf que des restaurations, nous n’en faisons presque jamais, pour ne pas dire jamais tout simplement. Je me souviens vaguement d’avoir restauré un « /etc/passwd » victime d’un « vi >/etc/passwd » (le classique du genre) il y a deux ou trois ans, mais c’est à peu près tout.

« Lançons-nous dans la restauration des archives », ai-je lancé fièrement à la foule en délire de la salle de rédaction. Et là, tel le sauveur, j’allais me connecter à la machine virtuelle qui produit les snapshots et les sauvegardes de la baie de stockage. C’est elle qui a pour mission, chez nous, de créer les snaps et de les « enrouler sur bande ». Classique quoi.

Je lance la console de restauration et je regarde les schedules. Une full par mois, le 15, quatre semaines de rétention, et un snapshot toutes les nuits.

Je prends mon calendrier. « On est bon pour quelques heures », me dis-je en soliloque.

J’ai oublié de le préciser, nos archives sont toutes en format PDF signé, pour nous assurer qu’elles ne sont pas altérées.

Je note les snaps à rejouer pour revenir à la dernière full, mi-décembre.

Prudent comme pas deux, je me dis que je vais commencer par restaurer deux ou trois mois, pour m’assurer que tout va bien et que c’est récupérable.

Et, en effet, ça marche. En moins de temps qu’il faut à un marchand de voiture à convaincre un centenaire qu’il a besoin d’une sportive, j’ai récupéré mes fichiers. Quelle fierté, je dois bien l’avouer.

Là, je retourne sur mon poste de travail, et je vais sur l’archive du mois de novembre. Je tente d’y ouvrir un premier fichier… Corrompu. Surprenant, mais admettons. Un second, corrompu lui aussi.

Je vais sur octobre, même chose sur cinq fichiers.

C’est à ce moment précis que les premières gouttes de sueur ont perlé sur mon front !

Nous sauvegardions du PDF signé, sur une baie de stockage via des snapshots. Je refais le parcours en chemin, recherche des blocs modifiés, flag de back-up, écriture sur disque… Rien qui cloche sur le chemin.

Je rappelle mon ami de chez X et lui expose mon souci. Il me parle de corruption des blocs de snap, de schedule défaillant. Rien de tel de trouvé, ni sur la baie de stockage, ni sur le serveur de sauvegarde.

Et, là, je me pose une question. Que se passe-t-il exactement quand un fichier est sauvegardé ? Le logiciel de back-up en lit les blocs, puis il « attribue » le statut « Sauvegardé » au fichier, pour savoir qu’il a été sauvegardé (on l’appelle aussi archive selon les cas).

Je prends le premier fichier PDF que je trouve sur mon PC, je l’ouvre et, pendant qu’il est ouvert, je modifie ses attributs pour le mettre en lecture seule. Pan ! Échec, le fichier est ouvert.

Je fais le tour visuel de la salle de rédaction et je vois, à côté de l’imprimante, un PC, l’écran de veille en fonction. Je pose la question à la communauté : « Il sert à quoi le PC là-bas ? »

Là, la réponse fuse de la part de Frédéric : « C’est sur celui-là qu’on ouvre les dernières épreuves avant de les envoyer en print. » Je me répète mentalement « On ouvre les dernières épreuves avant de les envoyer en print… » Je demande à Fred : « Et vous l’éteignez le soir ce PC ? » Je connaissais la réponse, autrement il n’aurait pas été allumé, ça coule de source.

Je vais sur le PC, en secoue le mulot, et là, à l’écran, apparaissent des dizaines de fichiers PDF ouverts, laissés tels quels, en plan à l’écran.

Ces dizaines de fichiers PDF, ce sont les quelques derniers mois de notre magazine, en gros depuis la dernière coupure de courant, au cours de l’été dernier, il me semble.

Grâce à ce PC, j’ai pu restaurer sept mois de publications, à peu près. Donc, sur le plan fonctionnel IT, les choses sont rentrées dans l’ordre : affaire suivante. Affaire suivante, certes, sauf qu’une question me taraude. Nous avons une belle solution de sauvegarde, c’est vrai, mais pas de restauration !

Et pour cause, si nous sauvegardons des données inexploitables, nous restaurerons des données inexploitables le jour de la catastrophe.

La morale de cette histoire, s’il en est une, est que se reposer sur les lauriers d’un système qui ronronne est la pire de choses pour un administrateur IT. Avoir mis en place une solution de sauvegarde ou un pare-feu, mais ne jamais tester si ce qu’on a mis en place fonctionne et produit le résultat escompté, c’est marcher sur un fil sans vérifier qu’il est bien accroché aux deux extrémités.

Il m’a suffi de dix minutes pour mettre en place un « pré-snapshot » qui vérifie que le fichier n’est verrouillé nulle part avant de lancer la sauvegarde et générer une alerte pour prévenir le cas échéant. Et une demi-heure pour automatiser, une fois par jour, la restauration d’un fichier et son ouverture en automatique, avec un code retour, pour s’assurer que les fichiers restaurés sont bel et bien exploitables.

Ce n’est ni une usine à gaz, ni une solution à plusieurs zéros. Ce n’est que du bon sens.

Et vous, quand faites-vous votre prochaine restauration ?

Leçon apprise ?

#blocs