> Tech > Annexe 1 : Une vraie reprise est-elle toujours possible ?

Annexe 1 : Une vraie reprise est-elle toujours possible ?

Tech - Par Renaud ROSSET - Publié le 24 juin 2010
email

Malgré ce que prétendent certaines publicités, quand un sinistre frappe, il faut bien plus qu'une bonne police d'assurance pour ramener la situation à  la normale. Et, dans certains cas, il est tout simplement impossible de ramener une entreprise au point qui était le sien avant le sinistre.
Mike Hotek, principal

Annexe 1 : Une vraie reprise est-elle toujours possible ?

instructeur et
l’un de mes collègues chez Solid Quality
Learning, est l’un des meilleurs experts
mondiaux en réplication SQL Server et
haute disponibilité. Comme consultant,
Hotek travaille avec des sociétés de toutes
tailles, des firmes Fortune 100 jusqu’à  des
PME d’une dizaine de personnes. Douze
des sociétés clientes de Hotek étaient présentes
dans le World Trade Center de New
York le 11 septembre 2001. Parmi ces
douze sociétés, sept ont été détruites ce
jour-là  voilà  deux ans. Même si certaines
données ont survécu, il ne restait plus personnes
dans les entreprises pour s’en
soucier.
Les survivants de chacune des cinq
autres sociétés ont demandé l’aide de
Hotek. La première d’entre elles a appelé
deux jours après l’attaque. Hotek n’a
passé qu’une demi-journée à  travailler
avec cette société parce que toutes les
données qu’elle possédait et toute information
sur la manière de recréer les données
avaient disparu dans l’effondrement
des Twin Towers. L’activité n’a donc pas
survécu. Deux des autres quatre sociétés
qui avaient eu des survivants se trouvaient
dans des situations similaires – il ne leur
restait tout simplement plus rien pour redémarrer
leur activité. Les deux sociétés
restantes avaient survécu – principalement
parce qu’elles avaient appliqué les
suggestions de Hotek en matière de prévention
de sinistre et de préparation.
Hotek m’a narré ses expériences avec ces
sociétés survivantes.
Pendant la première semaine qui a
suivi les attaques, Hotek n’a pas dormi
plus d’une heure par nuit. Malgré toute la
planification et la préparation de prévention
des sinistres que ses clients avaient
faites, la reprise a demandé deux semaines
de dur travail. Toutefois les deux
sociétés étaient revenues à  un niveau
fonctionnel minimum après une semaine,
grâce à  une heureuse coïncidence. Les
deux sociétés avaient commandé du nouveau
matériel avant l’attaque, donc au
cours de la semaine après le 11 septembre,
ils avaient contacté le fournisseur
de matériel et redirigé ce dernier vers les
nouvelles adresses des sociétés. Ces
commandes de matériel pré-existantes
sont devenues le point de départ de leurs
nouveaux systèmes. Une société a été entièrement
opérationnelle en environ 18
jours ; l’autre fonctionnait normalement
après un mois environ.
L’ampleur de ce sinistre particulier a
rendu la reprise du site complet différente,
de deux manières, des autres sinistres qui
demandent une reconstruction de système
complète. Tout d’abord, en raison de
l’étendue des dégâts, personne ne savait
le temps qu’il faudrait pour remettre le
système sur pied. Aucun dirigeant de la
société ni aucun actionnaire n’était
en train d’harceler Hotek et les survivants,
en demandant « Combien de temps
encore ? ». Le seul fait que les sociétés
aient des survivants était un miracle, donc
la seule nouvelle que l’activité pourrait reprendre
dépassait les espoirs de chacun.
Par conséquent, aucune pression externe
n’a poussé les sociétés à  accélérer leur
reprise.
La seconde raison pour laquelle cette
reprise était différente des scénarios classiques
était plus personnelle. Bien que
beaucoup de stratégies de prévention des
sinistres prévoient que plus d’une
personne détient tous les mots de passe
du système et sait où les sauvegardes
sont stockées, très peu prévoient en réalité
ce qu’ils feraient si toute l’équipe IT
n’était plus disponible. Les deux sociétés
survivantes avaient perdu la plupart des
membres de leurs équipes IT et ceux qui
restaient étaient sous le choc. Heureusement,
dans les deux cas, Hotek avait
aussi la plus grande partie de l’information
nécessaire parce qu’il avait aidé les entreprises
à  dresser leurs plans de reprise
après sinistre. Dans les deux cas, il était la
seule personne qui connaissait les exigences
technologiques de l’activité – et
c’est pourquoi il a peu dormi pendant un
certain temps. Bien que les dirigeants et
les actionnaires n’aient pas attendu une
reprise immédiate, Hotek a compris qu’il
devait aider les sociétés à  redresser la
situation le plus rapidement possible. Il a
entrepris six actions de base pour remettre
sur pied les deux sociétés :

  1. Déterminé les compétences disponibles
    parmi les survivants.

  2. Obtenu le budget pour le travail de reprise.
  3. Trouvé un site et commandé du nouveau
    matériel pour les systèmes les
    plus cruciaux.

  4. Recruté des sous-traitants pour aider à 
    reconstruire les systèmes.

  5. Localisé toutes les sauvegardes et
    documents de processus et déterminé
    quelles données étaient encore disponibles.

  6. Mis l’équipe IT survivante et les soustraitants
    au travail.

Pour les deux sociétés, une partie de
l’effort de reprise consistait à  planifier une
infrastructure de gestion des données entièrement
nouvelle qui intègrerait des stratégies
de prévention des sinistres et de reprise,
incluant à  la fois des systèmes
hot-standby et warm-standby. Hotek a
expliqué qu’il est devenu un expert en réplication en raison de son travail de
préparation aux sinistres. Quand il établit un
système répliqué, il obtient l’avantage immédiat
d’avoir un système évolutif distribué
et il a un warm-standby vers lequel se tourner
si certains systèmes sont perdus.
Deux ans plus tard, les deux sociétés
sont encore en activité et repeuplées, bien
qu’un peu plus petites qu’avant le 11 septembre.
Hotek travaille encore avec elles,
en effectuant des vérifications et des revues.
Il a encore une connaissance spécifique
de leurs systèmes qu’il est seul à 
avoir, parce qu’il a conçu et mis en oeuvre
ces systèmes. Mais il pense que son rôle
s’effacera au cours de l’année prochaine
date à  laquelle il envisage de transmettre
sa connaissance au personnel IT maison.
Aujourd’hui, les deux sociétés ont du matériel
hors site redondant qu’elles peuvent rapatrier
dans un bref délai. Toutes deux ont
des clusters à  une quarantaine de kilomètres
de leurs sites principaux et elles utilisent
le log-shipping pour tenir les clusters
éloignés synchronisés avec les systèmes
principaux. L’exposition à  la perte de données
est maintenant limitée à  environ 5 minutes.
Ironiquement, les deux sociétés
avaient ce niveau de redondance dans les
phases de planification voilà  deux ans et
elles prévoyaient alors de commencer la
mise en oeuvre en octobre 2001.
J’ai demandé à  Hotek s’il avait tiré des
enseignements sur la prévention des sinistres
de son expérience après le 11 septembre.
Il m’a répondu que, selon lui, la leçon
la plus importante était que ce qu’il
avait répété à  ses clients pendant des années
était vrai : quand on se prépare pour
un sinistre, aucun scénario n’est trop invraisemblable.
Comme Hotek l’a su pendant
tout le temps, les facteurs qui ont aidé
les sociétés survivantes à  se remettre sur
pied ont été la planification, la préparation
et la persévérance.

Téléchargez cette ressource

Guide inmac wstore pour l’équipement IT de l’entreprise

Guide inmac wstore pour l’équipement IT de l’entreprise

Découvrez les dernières tendances et solutions IT autour des univers de Poste de travail, Affichage et Collaboration, Impression et Infrastructure, et notre dossier Green IT sur les actions engagés par inmac wstore pour réduire son impact environnemental

Tech - Par Renaud ROSSET - Publié le 24 juin 2010

A lire aussi sur le site

Revue Smart DSI

La Revue du Décideur IT