Synthèse
Lorsqu'il sera livré, l'Aurora du Laboratoire national d'Argonne sera le premier système de calcul intensif exascale des États-Unis construit sur une architecture Intel® Avec le sous-traitant Hewlett Packard Enterprise (HPE) et Intel, ainsi que le soutien du département de l'énergie des États-Unis, les performances d'Aurora devraient dépasser un exaFLOPS, qui équivaut à un milliard de milliards de calculs par seconde. Avec son échelle et ses niveaux de performance extrêmes, Aurora offrira à la communauté scientifique la puissance de calcul nécessaire aux recherches les plus avancées dans des domaines tels que la biochimie, l'ingénierie, l'astrophysique, l'énergie, les soins de santé, et plus encore.
Enjeux
En tant qu'agence de recherche de premier plan aux États-Unis, le Laboratoire national d'Argonne est à la pointe des efforts du pays pour fournir les futures capacités de calcul exascale. L'Argonne Leadership Computing Facility (ALCF), futur siège d'Aurora, fait progresser le calcul scientifique grâce à la convergence du calcul intensif, de l'analytique de données hautes performances et de l'IA.
Les ressources de calcul de l'ALCF sont à la disposition des chercheurs des universités, de l'industrie et des organismes gouvernementaux. Grâce à des prix importants en matière de temps de supercalcul et de services d'assistance aux utilisateurs, l'ALCF permet la réalisation de projets de calcul à grande échelle visant à résoudre certains des problèmes les plus importants et les plus complexes du monde dans le domaine des sciences et de l'ingénierie. Parallèlement à la volonté d'assurer la compétitivité, le département de l'énergie des États-Unis et l'ALCF voulaient permettre aux chercheurs de relever des défis tels que l'analyse guidée par l'IA d'ensembles de données massifs ou les simulations à grande échelle.
L'Argonne Leadership Computing Facility (ALCF) fera passer la recherche en matière de simulation, de données et d'apprentissage à un niveau supérieur lorsque l'installation dévoilera l'une des premières machines exascale du pays, Aurora, construite sur une architecture Intel®.
Solution
Au départ, Intel s'est appuyé sur ses compétences internes en matière de systèmes de calcul intensif et sur un partenariat étroit avec les experts en calcul intensif d'Argonne et HPE en tant qu'intégrateur. Ensemble, ils livreront le système exascale, Aurora, fournissant un exaFLOPS, ou un milliard de milliards de calculs par seconde.
L'équipe combinée a passé plusieurs années à concevoir le système et à l'optimiser avec des innovations logicielles et matérielles spécialisées afin d'atteindre les performances nécessaires aux projets de recherche avancée. D'autres exigences pour la conception d'Aurora comprenaient des composants ayant une fiabilité à long terme et une efficacité énergétique.
À son arrivée, Aurora sera dotée de plusieurs nouvelles technologies Intel®. Chaque nœud étroitement intégré sera doté de deux futurs processeurs Intel® Xeon® Scalable, ainsi que de six futurs processeurs graphiques basés sur l'architecture Intel® Xᵉ. Chaque nœud offrira également une efficacité de mise à l'échelle avec huit terminaux de structure, une architecture de mémoire unifiée et une connectivité à haut débit et à faible latence. Le système prendra en charge dix pétaoctets de mémoire pour les besoins de calcul exascale.
Les utilisateurs d'Aurora bénéficieront également de la technologie DAOS (Intel® Distributed Asynchronous Object Storage), qui permet de réduire les goulots d'étranglement liés aux charges de travail à forte intensité de données. La technologie DAOS, prise en charge par la mémoire persistante Intel® Optane™, permet un stockage d'objets défini par logiciel, construit pour une mémoire non volatile distribuée à grande échelle.
Le système s'appuiera sur l'architecture du supercalculateur HPE Cray Shasta, qui intègre le logiciel du système HPE de nouvelle génération pour permettre la modularité, l'extensibilité, la flexibilité du choix de traitement et une évolutivité sans faille. Il comprendra également l'interconnexion HPE Slingshot comme cœur de réseau, qui offre une série de nouvelles fonctionnalités importantes telles que le routage adaptatif, le contrôle de la congestion et la compatibilité Ethernet.
La plateforme de stockage parallèle Cray ClusterStor E1000 supportera les charges de travail de plus en plus convergentes des chercheurs en fournissant un total de 200 pétaoctets de nouveau stockage. La nouvelle solution comprend un système de stockage central de 150 Po, appelé Grand, et un système de fichiers communautaire de 50 Po, appelé Eagle, pour le partage des données. Une fois Aurora opérationnelle, Grand, qui est doté d'une bande passante d'un téraoctet par seconde (To/s), sera optimisé pour prendre en charge la science de la simulation convergente et les nouvelles charges de travail à forte intensité de données.
Le supercalculateur Aurora sera le premier système exascale des États-Unis à intégrer les prochaines innovations matérielles et logicielles d'Intel en matière de calcul intensif et d'IA, notamment :
- Les processeurs Intel® Xeon® Scalable de la future génération
- Les futurs processeurs graphiques basés sur l'architecture Intel® Xᵉ
- 230 pétaoctets de stockage basés sur la technologie DAOS (Distributed Asynchronous Object Storage), bande passante >25 To/s
- Le modèle de programmation unifié oneAPI conçu pour simplifier le développement sur diverses architectures de processeurs, de processeurs graphiques, de FPGA et d'IA
L'équipe Argonne s'appuiera sur le modèle de programmation oneAPI conçu pour simplifier le développement sur des architectures hétérogènes. oneAPI fournira un modèle de programmation unique et unifié pour divers processeurs, processeurs graphiques, FPGA et accélérateurs d'IA.
Résultats
L'équipe travaille actuellement sur le développement de l'écosystème pour la nouvelle architecture. L'ALCF a créé l'Aurora Early Science Program (ESP) pour s'assurer que la communauté des chercheurs et les applications scientifiques essentielles sont prêtes pour l'échelle et l'architecture de la machine exascale au moment du déploiement.
L'ESP a accordé du temps et des ressources de pré-production à divers projets qui couvrent le calcul intensif, l'analytique de données hautes performances et l'IA. La plupart des projets sélectionnés représentent des recherches si sophistiquées qu'elles ont dépassé les capacités des systèmes de calcul intensif conventionnels. Par conséquent, Aurora mènera la charge vers une nouvelle ère de la science où les efforts scientifiques à forte intensité de calcul, impossibles aujourd'hui, deviendront une réalité.
À propos de Hewlett Packard Enterprise
HPE combine calcul et créativité, de sorte que les visionnaires puissent continuer à poser des questions qui défient les limites du possible. HPE, qui s'appuie sur plus de 45 ans d'expérience, développe les supercalculateurs les plus avancés au monde, repoussant les limites des performances, de l'efficacité et de l'évolutivité. Avec des développements tels que l'environnement du programme HPE Cray pour l'architecture de supercalcul HPE Cray EX et l'interconnexion HPE Slingshot, HPE continue à apporter de nouvelles solutions pour la convergence des données et de la découverte. HPE offre un portefeuille complet de supercalculateurs, de stockage hautes performances, de solutions d'analytique de données et d'intelligence artificielle.
La science de la prochaine génération nécessite des systèmes de calcul intensif extrêmes
Les projets prévus pour la première fois sur Aurora représentent certains des efforts les plus difficiles et les plus exigeants en matière de calcul. Voici quelques-uns des nombreux projets acceptés dans le cadre de l'Aurora Early Science Program :
Développer des réacteurs de fusion sûrs et propres
La fusion, c'est-à-dire la façon dont le soleil produit de l'énergie, offre un énorme potentiel en tant que source d'énergie renouvelable. Un type de réacteur à fusion utilise des champs magnétiques pour contenir le combustible : un plasma chaud comprenant du deutérium, un isotope de l'hydrogène dérivé de l'eau de mer. Le Dr William Tang, physicien chercheur principal au laboratoire de physique des plasmas de Princeton, prévoit d'utiliser Aurora pour former un modèle d'IA afin de prédire les perturbations indésirables du fonctionnement du réacteur. Aurora ingérera des quantités massives de données provenant des réacteurs actuels pour former le modèle d'IA. Le modèle pourrait ensuite être déployé dans le cadre d'une expérience, afin de déclencher des mécanismes de contrôle qui empêcheraient les perturbations à venir. Grâce au calcul exascale, à l'émergence de l'IA et à l'apprentissage profond (deep learning), Tang apportera de nouvelles connaissances qui feront progresser les efforts pour atteindre l'énergie de fusion.
Neurones obtenus à partir de l'analyse des données de la microscopie électronique. L'encart montre une tranche de données avec des régions colorées indiquant les cellules identifiées. Le traçage de ces régions à travers de multiples tranches permet d'extraire les sous-volumes correspondant aux structures anatomiques d'intérêt. (Image fournie par Nicola Ferrier, Narayanan (Bobby) Kasthuri, et Rafael Vescovi, Laboratoire national d'Argonne)
Recherche en neurosciences
La Dr Nicola Ferrier, informaticienne principale à Argonne, travaille en partenariat avec des chercheurs de l'Université de Chicago, de l'Université de Harvard, de l'Université de Princeton et de Google. Cet effort de collaboration vise à utiliser Aurora pour comprendre la structure du cerveau à grande échelle et la façon dont chaque neurone se connecte aux autres pour former les voies cognitives du cerveau. L'équipe espère que ce travail ardu permettra de révéler des informations utiles à l'humanité, comme des remèdes potentiels pour les maladies neurologiques.
À la recherche de traitements plus efficaces contre le cancer
Amanda Randles, Alfred Winborne Mordecai et Victoria Stover Mordecai, professeur adjoint au département de génie biomédical de l'université Duke, et ses collègues ont mis au point le système « HARVEY ». HARVEY prédit le flux des cellules sanguines qui se déplacent dans le système circulatoire humain très complexe. Avec le temps qu'elle a passé sur Aurora, la Dr Randles cherche à réutiliser HARVEY pour mieux comprendre les métastases du cancer. En prédisant où les cellules métastasées pourraient voyager dans le corps, HARVEY peut aider les médecins à anticiper, dès le début, où des tumeurs secondaires pourraient se former.
Comprendre l'univers « Sombre »
La combinaison d'étoiles, de planètes, de gaz, de nuages et de tout ce qui est visible dans le cosmos ne représente que 5 % de l'univers. Les 95 % restants sont constitués de matière noire et d'énergie noire. L'univers ne fait pas que croître, son taux d'expansion s'accélère. La Dr Katrin Heitmann, physicienne et informaticienne au Laboratoire national d'Argonne, a de grands objectifs pour son travail avec Aurora. Ses recherches visent à obtenir une compréhension plus approfondie de l'univers sombre, que nous connaissons si peu aujourd'hui.
Cette simulation d'une structure massive, un soi-disant cluster de galaxies, a été réalisée sur le système Thêta d'Argonne, dans le cadre d'un ESP antérieur. La masse de l'objet est de 5,6e14 Msun. La couleur indique la température, et les zones blanches indiquent le champ de densité du baryon. (Image fournie par JD Emberson et l'équipe HACC)
Concevoir des avions plus économes en carburant
Le Dr Kenneth Jansen, professeur d'ingénierie aérospatiale à l'université de Colorado Boulder, poursuit la conception d'avions plus sûrs, plus performants et plus économes en carburant en analysant les turbulences autour du fuselage. La variabilité des turbulences rend difficile la simulation de l'interaction d'un avion entier avec celui-ci. Chaque seconde, les différentes parties d'un avion subissent divers impacts de l'écoulement de l'air. Par conséquent, le Dr Jansen et son équipe doivent évaluer les données en temps réel à mesure que la simulation progresse. Aujourd'hui, les systèmes de calcul intensif n'ont pas la capacité nécessaire pour cette tâche, car ils simulent l'écoulement de l'air autour d'un avion dix-neuf fois plus grand que sa vraie taille, voyageant à un quart de sa vitesse réelle.
Aurora permettra au Dr Jansen et à son équipe d'en apprendre davantage sur la physique fondamentale impliquée dans les conditions de vol réel et à pleine échelle. De là, ils peuvent identifier les domaines dans lesquels des améliorations de conception peuvent faire une différence importante pour les caractéristiques en vol.
HPE est fier de travailler avec Intel pour développer et fournir le premier supercalculateur exascale américain à Argonne. C'est un témoignage passionnant de la conception flexible et des capacités uniques du système et du logiciel de HPE Cray EX, ainsi que de notre interconnexion HPE Slingshot, qui sera la base des efforts scientifiques à grande échelle et des charges de travail centrées sur les données de l'Argonne. Le supercalculateur HPE Cray EX est conçu pour cette ère exascale transformatrice et la convergence de l'intelligence artificielle, de l'analytique, de la modélisation et de la simulation (tous en même temps sur le même système) à une échelle incroyable. » - Peter Ungaro, vice-président principal et directeur général, Calcul intensif et IA chez HPE
Soutenir le projet de Grand collisionneur de hadrons du CERN (LHC, Large Hadron Collider)
Le Dr Walter Hopkins, physicien à Argonne, est membre de l'expérience ATLAS, une collaboration internationale qui étudie les particules et les forces fondamentales qui composent notre univers. L'expérience ATLAS illustre les résultats des collisions de protons dans le Grand collisionneur de hadrons (LHC, Large Hadron Collider) du CERN.
Ces images ont été utilisées lors de la découverte historique du boson de Higgs en 2012, qui a complété le modèle standard de la physique des particules. Au cours des dix prochaines années, les expériences LHC et ATLAS modernisées recueilleront dix fois plus de données qui permettront de répondre aux questions qui restent en suspens, par exemple « Qu'est-ce que la matière noire ? » ou « Comment la gravité est-elle liée aux forces électromagnétiques, fortes ou faibles ? » Alors que la quantité de données sera multipliée par dix, la quantité de simulation nécessaire pour les études de physique augmentera de 100 fois, dépassant rapidement les ressources actuelles. Ce projet porte certaines des simulations les plus intensives en calcul sur des accélérateurs pour faire face à cette augmentation. En outre, le projet s'appuie sur le deep learning pour étendre la portée analytique des algorithmes actuels d'identification des particules. Avec ce projet, Aurora deviendra une ressource importante pour la découverte dans la prochaine phase de recherche de la nouvelle physique.
Un avenir prometteur pour la recherche
Le calcul exascale dotera les chercheurs d'un outil profond et transformateur. Les niveaux de performances, l'échelle et la capacité de traiter d'énormes ensembles de données d'Aurora offrent un potentiel incroyable. Ce système permettra de lever le voile sur des mystères qui ont laissé perplexes les scientifiques et les ingénieurs pendant des décennies. Aurora permettra également d'atteindre des niveaux d'innovation et de découverte sans précédent dans le domaine de l'ingénierie.
À propos du Laboratoire national d'Argonne
Basé dans l'Illinois, le Laboratoire national d'Argonne est un centre de recherche multidisciplinaire qui s'attaque aux questions les plus importantes auxquelles l'humanité est confrontée. Avec le soutien du département de l'énergie des États-Unis, Argonne collabore avec de nombreuses organisations, y compris des entreprises et des institutions universitaires, et d'autres laboratoires dans tout le pays, pour permettre des percées scientifiques dans des disciplines telles que la physique, la cosmologie chimique et la biologie.