Un cluster Linux de 50 Tflops pour le nucléaire français
Inscrivez-vous gratuitement à la Newsletter BFM Business
Fin 2005, le CEA DAM a accueilli Tera 10, son nouveau supercalculateur de simulation d'essais nucléaires. Ce petit monstre est un cluster Linux géant de 544 n?"uds à base Intel, intégré par Bull.
Au CEA DAM(*) comme partout, calcul de haute performance rime désormais avec cluster Linux. Le Tera 10 en est la dernière démonstration, avec ses 544 octoprocesseurs sous Linux, fournissant une puissance
supérieure à 50 Tflops en crête. Autrement dit, ce sont 4 352 puces Itanium 2 modèle Montecito, composées chacune de deux c?"urs. Soit près de 9 000 processeurs au service des essais nucléaires virtuels...Le traité signé par la France en 1996 pour une interdiction complète des essais nucléaires a rapidement déclenché le lancement d'un programme de supercalcul, destiné à simuler numériquement ces opérations. ' La
simulation s'appuie sur un ensemble de logiciels qui traduisent des phénomènes physiques en modèles. C'est-à-dire en ensembles d'équations ', explique Jean Gonnord, chef du projet simulation numérique et informatique CEA DAM.
En 2001, Tera 1 tourne à 1 Tflop soutenu. Mais dès 1996 le CEA DAM avait planifié deux sauts de puissance successifs d'un facteur 10 tous les cinq ans : Tera 10 devra décupler les performances de Tera 1 en 2005, et Tera 100 celles de Tera
10 en 2010, pour dépasser 0,5 Pflop !
280 critères de sélection
L'exigence d'une puissance dix fois supérieure à celle de son prédécesseur, le CEA DAM l'a gravée dans l'appel d'offres du Tera 10. La nouvelle machine doit aussi être quinze à vingt fois plus efficace en entrées/sorties, avec des
n?"uds homogènes. Au total, près de 280 critères de sélection et plus de 50 mesures devaient départager les candidats. La quasi-totalité des constructeurs du marché a répondu. Mais c'est Bull, un revenant du supercalcul hexagonal, qui l'a emporté.
Entre autres, l'un de ses atouts consiste à s'appuyer sur des puces standards du marché, avec sa technologie de communication FSS (Fame Scalability Switch).Dans Tera 10, un module FSS synchronise les échanges entre processeurs et mémoire dans un même n?"ud, et en assure la cohérence. Un autre agit de même entre les processeurs du n?"ud et les autres n?"uds. De son côté, Intel a
joué un rôle important, en ouvrant grand les portes de ses laboratoires au CEA DAM et à Bull, afin qu'ils suivent les évolutions du Montecito. Tera 10 est la première exploitation mondiale de cette puce encore en préproduction. La communication
entre n?"uds, quant à elle, se trouve assurée par un triple réseau à 2 Go/s, fourni par Quadrics. La firme italienne équipe de longue date les clusters Linux scientifiques. Elle limite, par exemple la latence d'échanges de données entre les
n?"uds à 4 microsecondes.Alors, au CEA DAM, il ne reste plus qu'à attendre le mois de juin, date de la publication du prochain Top 500 mondial des supercalculateurs. Le Tera 10 pourrait s'y placer parmi les cinq premiers.e.delsol@01informatique.presse.fr(*) Commissariat à l'énergie atomique ?" Direction des applications militaires.