Inscrivez-vous gratuitement à la Newsletter BFM Business
Yacast, PME parisienne, nous a ouvert ses portes durant la migration de sa base Oracle d'un Compaq Alpha vers des serveurs Intel. Parcours d'une équipe projet sous pression.
Le serveur de bases de données de Yacast frôlait la saturation. En cause : l'accroissement des sites et des flux internet à surveiller et celui du nombre de clients. La PME parisienne spécialisée dans la pige publicitaire décide
donc, courant 2005, de prendre les devants et de remplacer un équipement vieillissant ?" une base Oracle hébergée sur un serveur DEC doté d'un processeur Alpha ?", installé depuis 1999. Après consultation, la société se tourne vers des
petites structures qui ont su la convaincre de leur capacité à répondre rapidement aux exigences pour un budget moindre. Elle retient trois prestataires. Algos Network fournit les serveurs ' no name '
compatibles Intel, Magirus les équipements de stockage, et NSS (Non Stop Systems) assure l'intégration système. Le projet débute à la mi-novembre. Il est prévu sur six semaines. C'est sans tenir compte de l'incompatibilité entre les logiciels, d'une
panne, d'un retard de livraison... Histoire d'une migration avec son lot de pépins ordinaires.
Semaine 1 : l'optimisme est au rendez-vous
Dans la salle de réunion, située au rez-de-chaussée d'un petit hôtel particulier, l'ambiance est détendue. ' Faites attention à ce que vous dites, il y a un journaliste qui note
tout ! ' plaisante Xavier Fabre, le directeur du projet. Harold Coudeyras, d'Algos Network, fait le point sur l'avancée des travaux : ' Les câbles sont tirés, et les serveurs sont dans les
racks. On tient le planning. ' Il mentionne toutefois un retard de livraison de la baie EMC CX300 et la panne d'un lecteur dans le robot de Quantum. Marc Triboulet, gérant de NSS, confirme que son équipe est prête :
' Nous avons terminé les cahiers de travail. ' L'installation des systèmes d'exploitation et du cluster débutera, comme prévu, dès la semaine suivante. Christophe Artozoul, de Magirus, rappelle qu'il
aura besoin d'informations sur la volumétrie et l'adressage réseau pour achever la configuration des cartes Fibre Channel et des contrôleurs Raid, qui assurent le double lien et la redondance. L'affaire semble bien engagée, et tous les intervenants
affichent une mine rayonnante.
Semaine 2 : une incompatibilité insoupçonnée découverte
De retour d'un salon informatique, Harold Coudeyras raconte, à grand renfort de gestes : ' Quand j'ai parlé de panne sur le stand de Quantum, une solution a été trouvée très
rapidement ! ' Autour de la table, tout le monde sourit. Debout près du paperboard, le gérant de NSS explique que l'installation de la baie EMC a été difficile : ' Une fonction non documentée
impose que l'adresse IP de la baie soit inscrite dans un fichier à la racine des serveurs. ' Dans ses petits souliers, son équipe admet, par ailleurs, avoir perdu beaucoup de temps à cause d'une erreur d'interprétation du
tableau de compatibilité d'EMC. L'ingénieur de NSS détaille : ' La matrice spécifiait une garantie de fonctionnement avec la version SP1+ du système Linux. J'ai compris SP1 et supérieur. ' Il a
fallu réinstaller entièrement les deux serveurs Linux avec la version SP1+ de Suse. Le problème est maintenant résolu. Plongé dans ses documentations, le directeur technique de Yacast hoche la tête en signe d'assentiment : les liens FC
redondants ont été testés avec succès. Penché sur ses notes, Xavier Fabre précise : ' La semaine prochaine, il est prévu d'installer la base Oracle et de mettre en ?"uvre la sauvegarde sur
bande. ' A ce stade, le projet a deux jours de retard.
Semaine 3 : l'outil de sauvegarde ne tient pas ses promesses
Comme prévu, NSS a procédé à l'installation du logiciel de sauvegarde Retrospect d'EMC. Sans problème apparent. Néanmoins, les tests fonctionnels montrent que toutes les fonctions attendues pour sauvegarder la base Oracle dans la baie
EMC n'étaient pas disponibles. Il ne s'agit que d'un problème de pilotes, mais l'incident est jugé bloquant. Renseignements pris chez le constructeur, aucune solution n'est proposée. NSS doit soumettre rapidement une alternative. Le logiciel
Retrospect est abandonné au profit d'Arcserve, de CA, plus onéreux. De plus, il sera nécessaire de mettre en ?"uvre le module de sauvegarde R-Man, intégré à la base Oracle. Harold Coudeyras, d'Algos Network, rassure l'auditoire :
' Cela n'aura aucun impact sur les performances. ' C'est néanmoins une remise en cause de l'architecture de sauvegarde : les postes de travail seront protégés par le logiciel Arcserve, et non plus
par un outil spécifique installé sur le réseau local. Ces différents incidents retardent un peu plus le projet. Le planning risque de ne pas être tenu.
Semaines 4 et 5 : nième réinstallation des serveurs
Les visages fatigués témoignent d'une semaine difficile. Xavier Fabre récapitule : ' Dès lundi, pour une raison indéterminée, peut-être une erreur de saisie, la base de données a été corrompue, des fichiers
effacés, et des problèmes de configuration et de synchronisation sont apparus. ' Aucune solution n'ayant été trouvée, il décide tard dans la nuit du lundi de faire réinstaller une nouvelle fois le système Linux, le cluster et
Oracle. L'opération prend toute la journée du mardi et se solde par un demi-succès. Certaines fonctions ne sont pas disponibles et Linux génère une erreur d'allocation mémoire au lancement de l'agent de R-Man. Harold Coudeyras, telle Cassandre,
s'exclame : ' Je le sentais, la sauvegarde va nous créer des ennuis jusqu'au bout ! ' Cette fois, personne ne sourit. Marc Triboulet détaille : ' Linux générait une
erreur d'allocation de mémoire dès que 8 Go étaient consommés. Nous avons tous mis très longtemps à comprendre qu'il s'agissait d'un paramétrage par défaut de Linux, qu'il convenait de modifier. ' Après reconfiguration,
le système et la base de données sont opérationnels et stables. Christophe Artozoul, lui, rapporte deux incidents reproductibles. Lors du redémarrage du serveur Linux, la charge des deux processeurs EMC n'est plus équilibrée. Un incident a été
remonté chez EMC. Il y a également des erreurs avec les cartes FC Fibre Channel au démarrage. La solution est simple. ' Lancez la baie, et allez prendre un café pendant qu'elle s'initialise. Ensuite, démarrez le serveur, et la
baie sera reconnue ', indique Christophe Artozoul. Sinon, le serveur enverra une requête avant que la baie ait eu le temps de s'initialiser, générant ainsi une erreur. Tous ces incidents ont retardé le projet d'une
semaine.
Semaine 6 : dernières retouches avant le recettage
La semaine est consacrée aux derniers ajustements sur les systèmes et à la validation de tous les composants, matériels ou logiciel. Le cahier de recette est déroulé par NSS. Il permet la formation au cluster et à l'ensemble des
éléments. Cette étape passée, Yacast lance une campagne de tests de production de deux semaines incluant la base Oracle et les systèmes de sauvegarde. La mise en production, à l'origine programmée pour la dernière semaine de décembre, ne s'est
finalement faite qu'à la mi-janvier.redaction@01informatique.presse.fr