Des abonnements
pour l'enrichissement
14 mai 2018 | La Revue POLYTECHNIQUE 03/2018 | Informatique

La Grille de calcul mondiale pour le LHC

La Grille de calcul mondiale pour le LHC est une infrastructure informatique décentralisée organisée par niveaux, qui fournit à une communauté de plus de 8000 chercheurs, un accès aux données du Grand collisionneur de hadrons en temps quasi réel. La Grille traite plus d’un million de calculs par jour. Lors des pics de distribution de données, ses serveurs peuvent transférer chaque seconde jusqu’à 10 Go de données.

Dans le Grand collisionneur de hadrons (LHC) du CERN, des particules entrent en collision environ 600 millions de fois par seconde. Chacune de ces collisions produit des particules qui se décomposent en formant d’autres particules beaucoup plus nombreuses. Des circuits électroniques enregistrent le passage de chaque particule à travers un détecteur sous la forme d’une série de signaux électroniques, puis les envoient au Centre de données du CERN, afin qu’elles soient reconstituées numériquement. Les chercheurs doivent passer au crible toutes ces données afin de déterminer si les collisions ont produit des résultats intéressants pour la physique.

Le CERN ne dispose ni des moyens informatiques, ni des ressources financières pour analyser toutes les données sur place. Pour cette raison, il utilise depuis 2002 la technique de la grille pour confier une partie du travail à des centres de calcul répartis dans le monde entier.
 
Fig. 1. Les quatre principaux éléments de la Grille de calcul mondiale pour le LHC sont les logiciels de physique, les intergiciels, le matériel informatique et les réseaux. (Photo: CERN)
 



Une collaboration entre des centres de calcul du monde entier
La Grille de calcul mondiale pour le LHC (WLCG) est une collaboration entre plusieurs centres de calcul répartis dans le monde entier. Lancée en 2002, elle a pour but de fournir les ressources nécessaires au stockage, à la distribution et à l’analyse des 15 pétaoctets (15 x 1015 octets) de données générées chaque année par le LHC. Organisée par niveaux (fig. 1), la Grille fournit à une communauté de plus de 8000 chercheurs, un accès aux données du LHC en temps quasi réel. Elle s’appuie sur la technologie du World Wide Web, inventée au CERN en 1989.
 
Un centre de données d’une capacité de 3,5 MW
L’ensemble des serveurs situés dans la salle principale de 1450 m2 du Centre de données (fig. 2.) correspond au niveau 0, le premier point de contact entre les données expérimentales du LHC et la Grille. Outre des serveurs et des systèmes de stockage de données pour le niveau 0 et pour des analyses de physique ultérieures, le Centre de données héberge également des systèmes indispensables au fonctionnement quotidien du CERN.
Les serveurs sont soumis à des mises à jour et à des opérations de maintenance permanentes, afin que leur fonctionnement continue d’être assuré en cas d’incident, tel qu’une coupure de courant prolongée. Les serveurs critiques, qui disposent de leur propre pièce, sont alimentés et refroidis par des équipements dédiés.
Début 2013, le CERN a accru la capacité informatique du centre, qui est passée de 2,9 MW à 3,5 MW, ce qui a permis d’installer davantage d’ordinateurs. Auparavant, les améliorations de 2011 en termes d’efficacité énergétique avaient permis de réaliser une économie d’énergie estimée à 4,5 GWh par an.
 
Fig. 2. Les expériences du CERN produisent des quantités astronomiques de données, qui sont stockées et envoyées partout dans le monde par le Centre de données. (Photo: CERN)
 



Un flux colossal de données à traiter
Les détecteurs enregistrent le passage de chaque particule produite par des collisions à de très hautes énergies. Des microprocesseurs convertissent leur trajectoire et leur énergie en signaux électriques, regroupant les informations afin de créer un résumé numérique de la collision («événement»). Chaque événement produit environ un million d’octets de données brutes, sachant qu’il se produit quelque 600 millions d’événements par seconde.
Le flux de données attendu pour les quatre expériences pendant la deuxième période d’exploitation est d’environ 25 Go/s. La Grille traite cette montagne de données en deux étapes. Tout d’abord, elle exécute des algorithmes spécifiques permettant d’éliminer certains événements - soit parce que les physiciens du CERN les connaissent déjà -, soit parce qu’ils les considèrent comme inintéressants. Les physiciens peuvent ainsi se concentrer sur les données les plus importantes, celles qui pourraient conduire à de nouvelles découvertes en physique.
La Grille traite plus d’un million de calculs par jour. Lors des pics de distribution de données, ses serveurs peuvent transférer chaque seconde jusqu’à 10 Go de données.
 
Les logiciels de physique
Les centres de calcul du WLCG sont composés de systèmes de stockage de plusieurs pétaoctets et d’ordinateurs disposés en grappes, avec des milliers de nœuds connectés par des réseaux haut débit (fig. 3). Afin de répondre aux besoins évolutifs de la communauté de la physique des hautes énergies, ces centres de calcul requièrent des outils logiciels plus sophistiqués que ceux disponibles dans le commerce.
Parmi les logiciels de physique qu’utilise la Grille, figurent des programmes tels que ROOT, une série de bibliothèques centrales orientées objet, POOL, une structure qui permet de stocker les données des événements, ainsi que d’autres logiciels permettant de modéliser la production, la propagation et les interactions des particules élémentaires. Les projets de la Grille fournissent une grande partie des logiciels qui gèrent la distribution et l’accès, l’envoi des calculs, ainsi que l’authentification et l’autorisation des utilisateurs. Ils fournissent également des logiciels appelés «intergiciels».
 
Fig. 3. Des kilomètres de câbles relient les quatre détecteurs principaux du LHC aux serveurs du Centre de calcul du CERN. (Photo: CERN)
 
 

Les intergiciels
Bien que la Grille dépende des réseaux informatiques et de communication de l’Internet, des logiciels novateurs permettent aux utilisateurs d’accéder aux ordinateurs répartis dans le monde entier. Ces logiciels sont appelés «intergiciels», car ils se situent entre les systèmes d’exploitation des ordinateurs et les logiciels d’applications de physique capables de résoudre les problèmes spécifiques des utilisateurs.
 
Le matériel informatique
L’installation et la mise à jour manuelle et régulière des logiciels est un travail intensif, raison pour laquelle des systèmes de gestion - tels que Quattor, développé au CERN -, réalisent ces opérations automatiquement. Ces systèmes font en sorte que les logiciels adéquats soient installés, depuis le système d’exploitation jusqu’aux bibliothèques propres à chaque expérience, et que l’information soit disponible pour l’ensemble du système d’ordonnancement de la Grille, qui attribue les calculs aux centres disponibles. Les onze centres de niveau 1 ont également en charge la maintenance des serveurs de stockage sur disque et sur bande, qui doivent être mis à niveau régulièrement.
 
Les réseaux
Le service de transfert de fichiers de la Grille gère l’échange d’informations entre les différents centres de la Grille. Ce service a été conçu pour répondre aux besoins particuliers du calcul sur grille, notamment l’authentification et la confidentialité, la fiabilité et la tolérance aux pannes, ainsi que le transfert à un tiers ou le transfert partiel de fichiers. Des liaisons de fibres optiques fonctionnant à un débit de 10 Gbit/s relient le CERN aux centres de niveau 1 du monde entier. Ce réseau large bande dédié est le Réseau optique privé du LHC (LHCOPN, LHC Optical Private Network).
 
Source: CERN