Le cloud hybride du CERN permet une recherche révolutionnaire

Les scientifiques exploitent le plus grand accélérateur de particules du monde et la technologie Intel® pour comprendre la composition de l'univers.

Synthèse
Le laboratoire européen pour la physique des particules connu sous le nom de CERN, étudie les blocs de construction subatomiques comprenant tout dans l'univers. Leur grand collisionneur de hadrons (LHC), le plus grand accélérateur de particules sur terre, force deux faisceaux de particules subatomiques dans des directions opposées autour d'un anneau de 27 kilomètre à des taux proches la vitesse de la lumière. Lorsque les faisceaux entrent en collision, les particules éclatent dans leurs composants les plus élémentaires. Les détecteurs capturent des volumes massifs de données en temps réel résultant des impacts. Ces données sont ensuite stockées et exploitées pour obtenir des informations avec l'aide de la solution de cloud hybride du CERN.

Défi
Ironiquement, pour comprendre les plus petites particules de notre univers, il faut d'énormes niveaux de puissance de calcul pour tirer un sens de volumes de données étendus. Chaque seconde, des détecteurs hautement sensibles capturent les pétaoctets de données résultant de chaque expérimentation à l'aide du LHC. Bien qu'un processus de filtrage réduit ce volume, il reste encore des dizaines de gigaoctets à capturer et à stocker en temps réel et sur site. Pour compléter leur infrastructure sur site, le CERN nécessite une solution de calcul et de stockage rapide, évolutive et adaptée au budget pour la simulation et la modélisation des données obtenues.

Solution
Vu que la bande passante entre les fournisseurs de services de cloud (CSP) et l'installation du CERN possède des limites pratiques, le processus de capture de données LHC reste localisé dans les propres centres de données du CERN architecturés pour la tâche. Après la phase de collecte de données, les solutions de cloud hébergé gèrent le processus d'évaluation des données du CERN. Deux CSP ont chacun conçu des solutions personnalisées pour les spécifications de stockage, de sécurité, de performances et d'hébergement d'applications du CERN. Les deux CSP offraient une capacité de machine virtuelle (VM) extensible et un stockage étendu pour faciliter la modélisation et la simulation des données du LHC.

Tunnel du grand collisionneur de hadron au CERN (crédit photo CERN)

Résultats
Les deux CSP ont prototypé et testé une solution de cloud hybride adaptée aux besoins spécifiques du CERN. Chaque solution hébergée fournir les vitesses de stockage, de traitement et de mise en réseau nécessaires au CERN aujourd'hui, avec une voie de croissance rationalisée vers l'avenir. De plus, parce que la solution de cloud hébergé peut être réutilisée par d'autres organismes de recherche en Europe lorsqu'elle n'est pas utilisée par le CERN, l'investissement financier profite à un groupe diversifié de scientifiques. Le cloud hybride crée de ce fait une plus large valeur et une performance de prix plus élevée.

"Notre équipe recherche constamment des manières d'optimiser et d'accélérer notre infrastructure, donc les solutions de cloud hybride sont extrêmement importantes pour notre travail". Nous avons le devoir de nous assurer que l'informatique ne limite pas la physique". – Tim Bell, chef de groupe de calcul et de suivi, département informatique, CERN

Le cloud hybride facilite les simulations à grande échelle et les exigences personnalisées
Le cloud hybride du CERN s'avère extrêmement apte à fournir l'infrastructure de calcul nécessaire pour des charges de travail spécialisées. En outre, une solution de cloud hybride hébergé répond à plusieurs autres exigences du CERN, notamment :

  • Rentabilité grâce à un modèle de paiement à l'utilisation
  • Conformité aux règles européennes de protection des données
  • La possibilité de porter des applications pertinentes vers le cloud
  • Capacité étendue de machine virtuelle
  • Identité fédérée et authentification unique
  • Évolutivité avec des ressources extensibles pour gérer des ensembles de données croissants

Joyau de la physique des particules, l'expérience CMS est un détecteur de 14 000 tonnes qui vise à résoudre un large éventail de questions sur les mystères autour du boson de Higgs et de la matière noire. Maintenant que le faisceau du grand collisionneur de hadrons (LHC) a été désactivé pour un arrêt technique de deux ans, Long Shutdown 2 (LS2), CMS se prépare à d'importants travaux de maintenance et mises à niveau. (Crédit photo : CERN)

Détails de la solution
Une solution de cloud hybride permet aux scientifiques du CERN de mettre en place des charges de travail clés dans l'emplacement idéal pour chaque tâche.

Les nœuds de serveurs sur site du CERN, complétés par leurs centres de données en Suisse et à Budapest, sont connectés en Ethernet 10 Go. Ensemble, ces centres de données bénéficient de la vitesse de calcul de 15 000 serveurs et de 230 000 cœurs de processeurs Intel® Xeon® de différentes générations, y compris les derniers processeurs Intel® Xeon® Scalable. Une combinaison de disques durs (HDD) et de disques SSD offre au CERN l'équilibre idéal entre le coût de stockage par gigaoctet et la vitesse nécessaire pour la capture de données en temps réel.

Une solution logicielle OpenStack* optimisée sous-tend le matériel sur site du CERN. OpenStack a été choisi pour la flexibilité et l’échelle qu’il apporte au travail du CERN. L'équipe du CERN travaille également en étroite collaboration avec d'autres scientifiques utilisant OpenStack ailleurs dans le monde. Ce faisant, les équipes peuvent partager les meilleures pratiques pour l'optimisation des logiciels qui peuvent potentiellement bénéficier à d'autres institutions de recherche.

Chacun des CSP hébergeant des analyses et des simulations de données pour le CERN offre la flexibilité de l'infrastructure pour s'adapter à une charge supplémentaire si nécessaire.

Le cloud hybride étend son infrastructure sur site pour un placement efficace de la charge de travail
Il y a des années, après que l'équipe du CERN eut terminé les phases de capture des données du LHC, elle avait besoin de réapprovisionner et d'optimiser ses ressources d'infrastructure pour le processus d'analyse des données. Les nouvelles solutions hébergées du CERN transforment ce processus en plaçant des charges de travail de simulation dans le cloud. La transition élimine le processus de réapprovisionnement, offre une plus grande échelle et allège les demandes de calcul sur site. Plutôt que de faire des investissements matériels supplémentaires sur site, un grand nombre de machines virtuelles hébergées gérant les charges de travail de simulation du CERN permettent un mécanisme plus simple, sécurisé, élastique et rentable pour accomplir la tâche.

Le cloud hybride offre une solution hautement évolutive et rentable pour plusieurs charges de travail
Le CERN dispose d'un budget limité pour accomplir des travaux de plus en plus complexes. Au vu des futures expérimentations LHC qui créeront des volumes de données encore plus importants, l'équipe avait besoin d'une solution pratique et soucieuse de son budget. Les solutions hébergées leur offrent non seulement des ressources de calcul et un stockage élevés, mais également l’élasticité nécessaire pour croître parallèlement aux ensembles de données plus importants du CERN attendus des futures expérimentations du LHC.

Gros plan sur le CERN
Basée à Genève, l'Organisation européenne pour la recherche nucléaire, communément appelée CERN, mène des travaux scientifiques révolutionnaires pour étudier la composition de la matière dans notre univers. Pour ce faire, des instruments avancés tels que le plus grand accélérateur de particules du monde, le grand collisionneur de hadrons (LHC), sont nécessaires. La boucle de 27 kilomètres du LHC est bordée d’électroaimants pour focaliser les faisceaux de particules et les accélérer près de la vitesse de la lumière. Lorsque les particules atomiques entrent en collision à l'intérieur de l'accélérateur, elles se brisent en leurs plus petites parties constituantes. Les chercheurs du CERN utilisent des détecteurs extrêmement sensibles pour observer et recueillir des données en vue d'une évaluation technique approfondie.

Événement enregistré avec le détecteur de solénoïde compact à muons (CMS) en 2012 à un centre proton-proton d'énergie de masse de 8 TeV. L'événement montre les caractéristiques attendues de la désintégration du boson SM de Higgs en une paire de photons (lignes jaunes en pointillés et tours vertes). (Crédit photo : CERN)

Leçons tirées
Grâce au RFP, au prototypage et aux tests de solutions de cloud hybride hébergé, l'équipe du CERN a noté plusieurs observations qui peuvent aider d'autres institutions scientifiques confrontées à des besoins similaires :

  • Plutôt que de construire seul une solution de cloud hybride, le CERN a présenté une liste d'exigences aux CSP et a donné aux CSP la liberté de concevoir la solution qui répondait le mieux à ces exigences.
  • La bande passante entre les installations du CERN et les CSP reste un facteur de déclenchement, faisant de l'infrastructure sur site une nécessité permanente pour la capture en temps réel des données du LHC.
  • Les scientifiques ont besoin d'une interface commune pour accéder aux données sur site ou dans le cloud.
  • Les pétaoctets de données du LHC devant rester accessibles pendant des décennies, une solution d'archivage à long terme et rentable doit augmenter les besoins de stockage à court terme.
  • Augmenter une solution purement sur site avec une solution de cloud hybride hébergé n'est pas seulement un changement technologique pour le personnel informatique, il nécessite également un changement culturel.

Ingrédients de la solution

  • Processeurs Intel Xeon Scalable

Plus d'infos
Le Cloud hybride associe services sur site et hors site ›
Prendre des décisions sur le cloud privé-public sur la voie d'un cloud hybride ›
Conseils pour réussir une stratégie de Cloud hybride ›

Découvrez les produits et solutions associés

Processeurs Intel® Xeon® Scalable

Générez des données exploitables, faites confiance à la sécurité assistée par matériel et mettez en place des prestations de services dynamiques avec les processeurs Intel® Xeon® Scalable.

En savoir plus

Solutions Intel® Select

Fournissez une infrastructure de centre de données simplifiée avec des configurations optimisées pour les charges de travail afin de faciliter et d'accélérer le déploiement.

En savoir plus

Avis et avertissements

Les fonctionnalités et avantages des technologies Intel® dépendent de la configuration du système et peuvent nécessiter du matériel et des logiciels compatibles et l'activation de certains services. Les performances varient d'une configuration à une autre. Aucun ordinateur ne saurait être totalement sécurisé. Consultez le constructeur ou le revendeur de votre ordinateur.vous pouvez consulter le site https://www.intel.fr pour en savoir plus. // Les logiciels et charges de travail utilisés dans les tests de performance ont peut-être été optimisés uniquement pour les microprocesseurs Intel®. Les tests de performance tels que SYSmark* et MobileMark* portent sur des configurations, composants, logiciels, opérations et fonctions spécifiques. Les résultats peuvent varier en fonction de ces facteurs. Pour l'évaluation d'un produit, il convient de consulter d'autres tests et d'autres sources d'information, notamment pour connaître le comportement de ce produit avec d'autres composants. Pour des informations plus complètes, visitez https://www.intel.fr/benchmarks. // Les résultats de performances s'appuient sur les tests réalisés aux dates indiquées dans les configurations et peuvent ne pas refléter toutes les mises à jour de sécurité disponibles. Pour obtenir plus de détails, veuillez lire les informations de configuration. Aucun produit ou composant ne saurait être totalement sécurisé. // Les scénarios de réduction de coûts décrits sont fournis à titre d'exemples montrant comment un produit de technologie Intel® donné, dans les circonstances et configurations spécifiées, peut affecter les coûts futurs et entraîner des économies de coûts. Les circonstances peuvent varier selon les cas. Intel ne garantit aucun coût ni réduction de coûts. // Intel ne maîtrise et ne vérifie pas les bancs d'essai cités ici ou sur les sites Web mentionnés en référence. Vous êtes invité à consulter vous-même ces sites Web et à vérifier l'exactitude des données. // Dans certains cas, les résultats ont été estimés ou simulés à l'aide d'une analyse, d'une simulation ou d'une modélisation d'architecture réalisée en interne par Intel et sont mentionnés à titre indicatif. Toute différence matérielle, logicielle ou de configuration du système peut avoir une incidence sur vos performances effectives.