Week-end très chaud !
MM. Red, Green, Yellow, Blue, Pink et Purple sont cadres dans des services informatiques. Chacun leur tour, ils vous feront partager le fruit de leurs expériences.
Plongés dans une lourde phase de migration matérielle et logicielle, nous avions décidé de nous accorder trois jours de repos. Je laisse donc le soin aux outils de contrôle et de supervision de veiller sur les matériels et les applicatifs critiques, le temps d'un week-end. Pourquoi les pannes imprévues et rares se produisent-elles dans de telles circonstances ? Dans la nuit de samedi à dimanche, un SMS me réveille, m'informant d'une température de 28 ?'C dans une salle informatique... J'alerte donc la société de maintenance de la climatisation. Après intervention sur site, il s'avère que la panne est sérieuse. Malheureusement, le climatiseur de secours n'a pas démarré immédiatement. Plusieurs serveurs n'ayant apparemment pas apprécié cette montée en température ont généré des alertes le dimanche. Devant cette escalade de problèmes, je me résigne à intervenir le lundi afin de contrôler toutes les machines de cette salle et les redémarrer. Comment anticiper ce type d'événement ? Nous pourrions mettre en ?"uvre une technique d'arrêt préventif à l'image de celle qui est pratiquée en cas de fin d'autonomie de batteries de l'onduleur. Le danger d'une telle automatisation serait de risquer de tout arrêter en pleine activité à cause d'une mesure de température erronée ! En fait, rien ne remplace l'appréciation et le discernement humain : c'est à la personne seule de décider d'arrêter un serveur ou pas. La tranquillité totale n'existe pas encore et c'est tant mieux ! Après tout, on s'en sort avec un disque dur à remplacer et un week-end très chaud pour certains. Et, pour la quasi-totalité des utilisateurs, rien ne s'est passé et l'outil de travail informatique fonctionne toujours aussi bien. Nest-ce pas cela le plus important ?
M.Purple@decisioninfo.net
M.Purple@decisioninfo.net
Votre opinion