par Spyros Sakellariadis - Mis en ligne le 04/03/2003
Il existe une foule d'articles sur
les concepts et stratégies de haute disponibilité,
et tout autant sur l'ingénierie
des composants des solutions
haute disponibilité. Vous attendez probablement
un article qui montre enfin
comment appliquer ces composants
dans votre environnement informatique.
Peut-être avez-vous promis un
SLA (service level agreement) ambitieux
à vos clients, et le moment est
venu de savoir comment tenir cette
promesse. Si vous devez configurer un serveur de fichiers, un serveur Web ou
un serveur DNS Windows 2000 haute
disponibilité, vous apprécierez sûrement
la palette de modèles de base
que propose cet article.
Architecture système haute disponibilité
La disponibilité d’une application est
inversement proportionnelle à son
temps d’immobilisation total dans une
certaine période (un mois en principe)
et le temps d’immobilisation total est
simplement la somme des durées
de chaque panne ou interruption.
Par conséquent, pour augmenter la disponibilité d’un système, il faut diminuer
la durée des pannes, réduire leur
fréquence, ou les deux. Avant plus
d’explications, vous devez comprendre
les phases d’une restauration
d’après panne.
Si la panne est grave, il faudra
construire un nouveau serveur à partir
de zéro et restaurer toutes les données
et services dans le temps dont vous disposez.
Supposons que vous ayez promis
un SLA de 99,5 %, en comptant sur
une seule panne par mois. (Pour plus
d’informations sur le calcul des pourcentages
de disponibilité, voir l’encadré
« Mesurer la haute disponibilité ».)
Dans les 3 heures et 43 minutes qui suivent
le début d’une panne, vous devrez
procéder aux cinq phases de restauration
suivantes :
1. Phase de diagnostic – Diagnostiquer
le problème et déterminer l’action
appropriée.
2. Phase d’approvisionnement –
Recenser, trouver, transporter et assembler
physiquement le matériel,
le logiciel et le média de sauvegarde
de remplacement.
3. Phase de mise en place – Configurer
le matériel du système et installer un
OS de base.
4. Phase de restauration – Restaurer
tout le système à partir du média, y
compris les fichiers système et les
données utilisateur.
5. Phase de vérification – Vérifier le
bon fonctionnement de tout le système
et l’intégrité des données utilisateur.
Indépendamment de votre SLA,
vous devez connaître la durée de la
phase. En effet, chaque phase peut introduire
des retards inattendus et inopportuns.
Ainsi, une phase de diagnostic
sans contrainte peut accaparer
beaucoup de votre temps disponible.
Pour que vos ingénieurs d’assistance
passent moins de temps à diagnostiquer
le problème, créez un arbre de
décision selon lequel les ingénieurs
passent à la phase d’approvisionnement
s’ils ne trouvent pas l’anomalie
en 15 minutes. La phase d’approvisionnement
peut elle aussi prendre du
temps si le média de sauvegarde est
hors site et s’il faut attendre sa livraison. Un jour, le camion chargé de
livrer une bande de sauvegarde hors
site a eu un accident en route vers
notre centre informatique. Vous pensez
peut-être que 3 heures et 43 minutes
est une durée bien courte pour
restaurer le service, mais en réalité,
vous pourriez fort bien ne disposer
que 2 heures.
Téléchargez cette ressource
Livre blanc Sécurité et Stockage des documents
Découvrez dans ce livre blanc Kyocera les outils logiciels qui permettent une approche holistique et efficace de la collecte, du stockage, de la gestion et de la sécurisation des documents en entreprise.
Les articles les plus consultés
Les plus consultés sur iTPro.fr
- Azul permet aux entreprises de simplifier leurs environnements Java
- AI Speech double toutes vos vidéos !
- Finance : l’IA générative plébiscitée pour les décisions stratégiques
- Cybersécurité : les comportements à risque des collaborateurs
- Prédictions 2025 : voici comment l’intelligence artificielle va redéfinir la sécurité de 3 façons