Le cloud hybride du CERN permet une recherche révolutionnaire

Les scientifiques exploitent le plus grand accélérateur de particules du monde et la technologie Intel® pour comprendre la composition de l'univers.

En bref :

  • Le CERN étudie les blocs de construction subatomiques qui comprennent tout dans l'univers.

  • Le grand collisionneur de hadrons (LHC) du CERN est le plus grand accélérateur de particules sur terre. Chaque seconde, des détecteurs extrêmement sensibles capturent les pétaoctets de données résultant de chaque expérimentation à l'aide du LHC. En raison des limites de bande passante, le processus de capture des données du LHC est localisé dans les centres de données du CERN conçus pour la tâche avec les processeurs Intel® Xeon® Scalable.

BUILT IN - ARTICLE INTRO SECOND COMPONENT

Synthèse

Le laboratoire européen pour la physique des particules connu sous le nom de CERN, étudie les blocs de construction subatomiques comprenant tout dans l'univers. Leur grand collisionneur de hadrons (LHC), le plus grand accélérateur de particules sur terre, force deux faisceaux de particules subatomiques dans des directions opposées autour d'un anneau de 27 kilomètre à des taux proches la vitesse de la lumière. Lorsque les faisceaux entrent en collision, les particules éclatent dans leurs composants les plus élémentaires. Les détecteurs capturent des volumes massifs de données en temps réel résultant des impacts. Ces données sont ensuite stockées et exploitées pour obtenir des informations avec l'aide de la solution de cloud hybride du CERN.

Enjeux

Ironiquement, pour comprendre les plus petites particules de notre univers, il faut d'énormes niveaux de puissance de calcul pour tirer un sens de volumes de données étendus. Chaque seconde, des détecteurs hautement sensibles capturent les pétaoctets de données résultant de chaque expérimentation à l'aide du LHC. Bien qu'un processus de filtrage réduit ce volume, il reste encore des dizaines de gigaoctets à capturer et à stocker en temps réel et sur site. Pour compléter leur infrastructure sur site, le CERN nécessite une solution de calcul et de stockage rapide, évolutive et adaptée au budget pour la simulation et la modélisation des données obtenues.

Solution

Vu que la bande passante entre les fournisseurs de services de cloud (CSP) et l'installation du CERN possède des limites pratiques, le processus de capture de données LHC reste localisé dans les propres centres de données du CERN architecturés pour la tâche. Après la phase de collecte de données, les solutions de cloud hébergé gèrent le processus d'évaluation des données du CERN. Deux CSP ont chacun conçu des solutions personnalisées pour les spécifications de stockage, de sécurité, de performances et d'hébergement d'applications du CERN. Les deux CSP offraient une capacité de machine virtuelle (VM) extensible et un stockage étendu pour faciliter la modélisation et la simulation des données du LHC.

Tunnel du grand collisionneur de hadron au CERN (crédit photo CERN)

Résultats

Les deux CSP ont prototypé et testé une solution de cloud hybride adaptée aux besoins spécifiques du CERN. Chaque solution hébergée fournir les vitesses de stockage, de traitement et de mise en réseau nécessaires au CERN aujourd'hui, avec une voie de croissance rationalisée vers l'avenir. De plus, parce que la solution de cloud hébergé peut être réutilisée par d'autres organismes de recherche en Europe lorsqu'elle n'est pas utilisée par le CERN, l'investissement financier profite à un groupe diversifié de scientifiques. Le cloud hybride crée de ce fait une plus large valeur et une performance de prix plus élevée.

Notre équipe recherche constamment des manières d'optimiser et d'accélérer notre infrastructure, donc les solutions de cloud hybride sont extrêmement importantes pour notre travail. Nous avons le devoir de nous assurer que l'informatique ne limite pas la physique". – Tim Bell, chef de groupe de calcul et de suivi, département informatique, CERN

Le cloud hybride facilite les simulations à grande échelle et les exigences personnalisées

Le cloud hybride du CERN s'avère extrêmement apte à fournir l'infrastructure de calcul nécessaire pour des charges de travail spécialisées. En outre, une solution de cloud hybride hébergé répond à plusieurs autres exigences du CERN, notamment :

  • Rentabilité grâce à un modèle de paiement à l'utilisation
  • Conformité aux règles européennes de protection des données
  • La possibilité de porter des applications pertinentes vers le cloud
  • Capacité étendue de machine virtuelle
  • Identité fédérée et authentification unique
  • Évolutivité avec des ressources extensibles pour gérer des ensembles de données croissants

Joyau de la physique des particules, l'expérience CMS est un détecteur de 14 000 tonnes qui vise à résoudre un large éventail de questions sur les mystères autour du boson de Higgs et de la matière noire. Maintenant que le faisceau du grand collisionneur de hadrons (LHC) a été désactivé pour un arrêt technique de deux ans, Long Shutdown 2 (LS2), CMS se prépare à d'importants travaux de maintenance et mises à niveau. (Crédit photo : CERN)

Détails de la solution

Une solution de cloud hybride permet aux scientifiques du CERN de mettre en place des charges de travail clés dans l'emplacement idéal pour chaque tâche.

Les nœuds de serveurs sur site du CERN, complétés par leurs centres de données en Suisse et à Budapest, sont connectés en Ethernet 10 Go. Ensemble, ces centres de données bénéficient de la vitesse de calcul de 15 000 serveurs et de 230 000 cœurs de processeurs Intel® Xeon® de différentes générations, y compris les derniers processeurs Intel® Xeon® Scalable. Une combinaison de disques durs (HDD) et de disques SSD offre au CERN l'équilibre idéal entre le coût de stockage par gigaoctet et la vitesse nécessaire pour la capture de données en temps réel.

Une solution logicielle OpenStack* optimisée sous-tend le matériel sur site du CERN. OpenStack a été choisi pour la flexibilité et l’échelle qu’il apporte au travail du CERN. L'équipe du CERN travaille également en étroite collaboration avec d'autres scientifiques utilisant OpenStack ailleurs dans le monde. Ce faisant, les équipes peuvent partager les meilleures pratiques pour l'optimisation des logiciels qui peuvent potentiellement bénéficier à d'autres institutions de recherche.

Chacun des CSP hébergeant des analyses et des simulations de données pour le CERN offre la flexibilité de l'infrastructure pour s'adapter à une charge supplémentaire si nécessaire.

Le cloud hybride étend son infrastructure sur site pour un placement efficace de la charge de travail

Il y a des années, après que l'équipe du CERN eut terminé les phases de capture des données du LHC, elle avait besoin de réapprovisionner et d'optimiser ses ressources d'infrastructure pour le processus d'analyse des données. Les nouvelles solutions hébergées du CERN transforment ce processus en plaçant des charges de travail de simulation dans le cloud. La transition élimine le processus de réapprovisionnement, offre une plus grande échelle et allège les demandes de calcul sur site. Plutôt que de faire des investissements matériels supplémentaires sur site, un grand nombre de machines virtuelles hébergées gérant les charges de travail de simulation du CERN permettent un mécanisme plus simple, sécurisé, élastique et rentable pour accomplir la tâche.

Le cloud hybride offre une solution hautement évolutive et rentable pour plusieurs charges de travail

Le CERN dispose d'un budget limité pour accomplir des travaux de plus en plus complexes. Au vu des futures expérimentations LHC qui créeront des volumes de données encore plus importants, l'équipe avait besoin d'une solution pratique et soucieuse de son budget. Les solutions hébergées leur offrent non seulement des ressources de calcul et un stockage élevés, mais également l’élasticité nécessaire pour croître parallèlement aux ensembles de données plus importants du CERN attendus des futures expérimentations du LHC.

Gros plan sur le CERN

Basée à Genève, l'Organisation européenne pour la recherche nucléaire, communément appelée CERN, mène des travaux scientifiques révolutionnaires pour étudier la composition de la matière dans notre univers. Pour ce faire, des instruments avancés tels que le plus grand accélérateur de particules du monde, le grand collisionneur de hadrons (LHC), sont nécessaires. La boucle de 27 kilomètres du LHC est bordée d’électroaimants pour focaliser les faisceaux de particules et les accélérer près de la vitesse de la lumière. Lorsque les particules atomiques entrent en collision à l'intérieur de l'accélérateur, elles se brisent en leurs plus petites parties constituantes. Les chercheurs du CERN utilisent des détecteurs extrêmement sensibles pour observer et recueillir des données en vue d'une évaluation technique approfondie.

Événement enregistré avec le détecteur de solénoïde compact à muons (CMS) en 2012 à un centre proton-proton d'énergie de masse de 8 TeV. L'événement montre les caractéristiques attendues de la désintégration du boson SM de Higgs en une paire de photons (lignes jaunes en pointillés et tours vertes). (Crédit photo : CERN)

Leçons tirées

Grâce au RFP, au prototypage et aux tests de solutions de cloud hybride hébergé, l'équipe du CERN a noté plusieurs observations qui peuvent aider d'autres institutions scientifiques confrontées à des besoins similaires :

  • Plutôt que de construire seul une solution de cloud hybride, le CERN a présenté une liste d'exigences aux CSP et a donné aux CSP la liberté de concevoir la solution qui répondait le mieux à ces exigences.
  • La bande passante entre les installations du CERN et les CSP reste un facteur de déclenchement, faisant de l'infrastructure sur site une nécessité permanente pour la capture en temps réel des données du LHC.
  • Les scientifiques ont besoin d'une interface commune pour accéder aux données sur site ou dans le cloud.
  • Les pétaoctets de données du LHC devant rester accessibles pendant des décennies, une solution d'archivage à long terme et rentable doit augmenter les besoins de stockage à court terme.
  • Augmenter une solution purement sur site avec une solution de cloud hybride hébergé n'est pas seulement un changement technologique pour le personnel informatique, il nécessite également un changement culturel.

Composants de la solution

  • Processeurs Intel® Xeon® Scalable

Plus d'infos

Le Cloud hybride associe services sur site et hors site ›
Conseils pour réussir une stratégie de Cloud hybride ›

Télécharger le PDF ›

Découvrez les produits et solutions associés