La HLRN dote le calcul intensif de performances avancées

Le HLRN a choisi les processeurs Intel® Xeon® Platinum 9200 pour répondre à ses besoins de plus en plus diversifiés en matière de charge de travail HPC.

En bref :

  • Le HLRN exploite un système de supercalcul massif parallèle qui alimente plus de 200 universités et instituts de recherche en Allemagne.

  • Le supercalculateur de prochaine génération du HLRN utilisera des processeurs Intel® Xeon® Platinum 9200 et Cornelis Networks produits1 pour un gain de vitesse jusqu'à six fois supérieur.

author-image

Par

Synthèse

Les supercalculateurs HLRN sont utilisés par plus de 100 universités et plus de 120 instituts de recherche, ce qui permet d'explorer les nombreux confins de la recherche scientifique afin de contribuer à la création d'un avenir meilleur. La sélection des dernières technologies de processeur Intel pour alimenter le dernier supercalculateur HLRN a été effectuée avoir mené des tests détaillés pour trouver la meilleure solution. Prof. Le Dr Ramin Yahyapour de l'Université de Göttingen explique que « l'acquisition du superordinateur du HLRN devait permettre d'augmenter considérablement la puissance des ordinateurs pour les nouvelles expériences ».

Enjeux

« La science en général est de plus en plus gourmande en calculs et en données. Cela signifie que le fait de disposer de systèmes plus importants se traduit par la possibilité pour les scientifiques de faire un meilleur travail. C'est pourquoi le HLRN est crucial pour la recherche scientifique », explique Prof. Ramin Yahyapour.

Le HLRN prétend être un client très exigeant, le HLRN dispose d'une grande expertise grâce à ses déploiements antérieurs de trois systèmes de superordinateurs. Prof. Alexander Reinefeld, de l'Institut Zuse de Berlin, souligne que « nous attendons les meilleures performances pour toutes les applications de référence. Notre ensemble de bancs d'essai a été soigneusement choisi de sorte que chaque code défie des parties spécifiques du système : CPU, réseau de communication et E/S parallèles. Nous ne recherchons pas une performance théorique de pointe, nous voulons une performance réelle du système, ce qui complique la tâche des fournisseurs qui doivent optimiser leur infrastructure pour nos applications. Cela signifie que notre sélection du bon processeur et de la bonne interconnexion sont toutes cruciales pour la performance globale ».

Comme c'est le cas dans le cadre de la plupart des recherches aujourd'hui, le besoin d'une plus grande capacité informatique dans le monde réel découle du fait que les chercheurs ont besoin de simulations de toutes sortes. Les ordinateurs plus rapides sont principalement utilisés pour augmenter la taille et la résolution de la simulation, dans l'espoir de faire de nouvelles découvertes.

Nous exigeons une véritable performance du système... Ce qui signifie que notre sélection du bon processeur et de la bonne interconnexion sont toutes cruciales pour la performance globale. — Prof. Reinefeld

Solution

Le HLRN est équipé d'un nouveau supercalculateur avec un peu moins d'un quart de million de cœurs. Les processeurs Intel® Xeon® Platinum 9200 (de la 2ᵉ génération de processeurs Intel® Xeon® Scalable) serviront de « processeurs adéquats » pour le HLRN. Pour la « bonne interconnexion », le HLRN a choisi Cornelis Networks produits. Le système est produit par Atos (anciennement Bull Computing) et sera physiquement partagé entre la Zuse-Institute Berlin (ZIB) et la Georg-August-Universität Göttingen (Université de Göttingen). Ces sites ont déjà utilisé ce modèle de systèmes à éléments séparés, et ont déjà mis en place un câble à fibre optique dédié et redondant de 10 gigabits couvrant les plus de 273 km entre Berlin et Göttingen.

Les chercheurs de la ZIB utiliseront le HLRN-IV pour la dynamique des fluides, notamment pour développer des modèles de turbulence pour les ailes des avions.

Résultat

Le HLRN a annoncé que le nouveau système, HLRN-IV, sera environ six fois plus rapide que les systèmes précédents, offrant une performance de 16 PetaFLOP/s. 2 L'enthousiasme des chercheurs est palpable, et la liste des recherches effectuées est ahurissante. Prof. Reinefeld a résumé son enthousiasme en disant : « C'est un excellent système. Nos utilisateurs bénéficieront immédiatement du système plus puissant sans avoir besoin de changer leur code. L'architecture homogène des processeurs Intel® Xeon® Scalable de deuxième génération permettra une véritable portabilité des performances. C'est un aspect crucial pour nos chercheurs afin de bénéficier rapidement de ce nouveau système plus puissant ».

Les principaux domaines de recherche au sein du HLRN sont les suivants :

  • La science du système terrestre - Ce qui inclut le travail sur le réchauffement climatique. Les sujets comprennent la dynamique des océans, des forêts tropicales, des glaciers, du phytoplancton antarctique (microalgues), des cycles des poussières minérales et de la stratosphère.
  • La dynamique des fluides - Qui inclut des modèles de turbulence pour les turbines de bateaux, les éoliennes et les ailes d'avions. Ces modèles sont connus pour nécessiter une énorme puissance de calcul. L'acquisition du HLRN-IV permettra d'effectuer des simulations de turbulences à grain plus fin sur de grands systèmes tels que le flux du vent dans une ville ou sur une pale d'une turbine. La modélisation de villes entières permettra d'étudier la façon dont les nouveaux bâtiments modifieraient le flux du vent, ainsi que d'autres facteurs qui ont un impact sur les différents microclimats de la ville. Cela peut conduire à concevoir de nouveaux aspects pour améliorer la vie en ville. D'autres chercheurs espèrent acquérir des connaissances qui ouvriront la voie aux futurs avions commerciaux de grande capacité. D'autres chercheurs espèrent sauver des vies et des navires en étudiant la liquéfaction de cargaisons solides en vrac (comme le minerai de fer ou de nickel). L'incapacité à traiter correctement cette question a entraîné la perte totale d'au moins sept navires dans le monde au cours de la dernière décennie.
  • La santé - est un vaste domaine de recherche et les chercheurs du HLRN espèrent y contribuer de nombreuses manières, notamment en améliorant les soins médicaux à domicile. Une meilleure compréhension des maladies et de leur traitement nous concerne tous. La recherche comprend des simulations de l'efficacité, des interactions et des effets secondaires des médicaments. Une puissance de calcul énorme permet aux chercheurs de pointe dans ces domaines de commencer à explorer les aspects de ces simulations concernant la « médecine personnalisée », et pas seulement les effets moyens sur une population générale.

À l'université de Göttingen, les domaines de recherche comprennent des projets de collaboration sur les machines cellulaires et moléculaires.

Haute performance dans un ensemble de recherches diversifié

Du point de vue des différentes communautés scientifiques, le HLRN doit supporter tous les types de charges de travail pour ses nombreux chercheurs. Par conséquent, les systèmes HLRN doivent présenter les caractéristiques d'un système à usage général tout en offrant les meilleures performances. Leur choix final ne comportait aucun accélérateur.

Bien que nous ayons examiné les accélérateurs, y compris les GPU, dans le cadre du processus d'achat, il n'y avait aucun avantage à obtenir les meilleures performances en utilisant les GPU ou d'autres accélérateurs dans le système, Dr. Thomas Steinke, chef du département de calcul intensif de la ZIB

Les points de référence du HLRN sont ouverts et comprennent des points de référence qui peuvent tirer parti des GPU. Le HLRN a constaté que tout avantage de performance sur certaines charges de travail est insuffisant, si l'on considère la réduction de la capacité de calcul à usage général, ou les coûts supplémentaires que cela implique. Un système homogène basé sur les processeurs Intel® Xeon® Scalable de deuxième génération s'est révélé être le meilleur choix pour les divers besoins des scientifiques et des chercheurs du HLRN.

Battre en brèche la loi d'Amdahl

Le Dr Thomas Steinke, toujours soucieux de la loi d'Amdahl, aime mettre l'accent sur l'utilisation d'algorithmes rapides pour des ordinateurs rapides. Il a déclaré que « la pression de l'optimisation du code pour la mise à l'échelle sur un nœud est moindre en raison des performances réelles élevées des processeurs Intel® Xeon® Scalable de 2ème génération par rapport aux précédentes architectures à plusieurs cœurs ».

La famille de processeurs Intel® Xeon® Scalable de deuxième génération offre un choix exceptionnel pour le calcul haute performance (HPC) et aide les programmeurs à faire face à la loi d'Amdahl.

Nos utilisateurs bénéficieront immédiatement du système plus puissant sans avoir besoin de changer leur code, Prof. Reinefeld

L'avenir de l'IA dans le HPC

L'IA et l'apprentissage automatique devraient impacter tous les domaines de recherche du HLRN. Un domaine d'intérêt majeur est le mélange de l'apprentissage automatique et des techniques d'IA avec les capacités de simulation traditionnelles. Si des résultats prometteurs ont été signalés, il reste encore beaucoup à faire. L'exploration des algorithmes est susceptible de mener les chercheurs dans de nombreuses directions, et ce besoin de flexibilité est l'une des raisons pour lesquelles le HLRN a choisi des processeurs Intel® Xeon® Scalable de deuxième génération pour soutenir sa prochaine génération de recherche.

Éviter le mouvement des données

Prof. Yahyapour a souligné que « le processeur est assez bon pour l'intelligence artificielle et l'apprentissage automatique. C'est un domaine dans lequel nous constatons un besoin accru de la part de nos chercheurs. Ils n'étaient traditionnellement pas réellement intéressés par le travail à forte intensité de données, mais c'est une nouvelle tendance pour le nouveau système qui sera également d'un intérêt tout particulier ».

Intel® Advanced Vector Extensions 512 (Intel® AVX-512) s'est avéré être le choix logique pour aider à augmenter la puissance de calcul du HLRN. Avec l'ajout d'Intel® Deep Learning Boost (Intel® DL Boost) pour augmenter l'AVX-512, il a offert des performances exceptionnelles pour ces nouvelles applications HPC.

La possibilité de calculer les données où qu'elles se trouvent, pour tous les types d'algorithmes, permet d'éviter le déplacement des données. Cela représente une augmentation de la capacité de calcul, et moins de gaspillage d'énergie. Une double victoire !

Lors de l'exploration de nouveaux algorithmes et de nouvelles techniques d'application, rien n'est plus important que la flexibilité d'un système. Le processeur Intel® Xeon® Scalable de deuxième génération offre des performances élevées associées à la flexibilité nécessaire pour relever les défis futurs.

Infos sur le produit et ses performances

1

Intel a cédé l'activité Omni-Path à Cornelis Networks, une société indépendante du portefeuille Intel Capital. Cornelis Networks continuera de servir et de vendre aux clients nouveaux et existants en fournissant des produits réseau hautes performances conçus spécialement pour le calcul intensif (HPC) et l'intelligence artificielle. Intel pense que Cornelis Networks étendra l'écosystème de solutions d'infrastructures hautes performances, en offrant des options aux clients qui construisent des clusters de calcul intensif et d'IA basés sur des processeurs Intel® Xeon™. Vous trouverez plus de détails sur la cession et la transition des produits Omni-Path à l'adresse www.cornelisnetworks.com.

2

Le système précédent, HLRN-III, se compose de deux complexes situés chez ZIB à Berlin et Leibniz Universität Services (LUIS) à Hanovre associés à une connexion fibre optique de 10GigE pour permettre à HLRN d'offrir son point de vue à système unique. Les détails des nœuds de calcul, fournis en deux phases, comprennent les éléments suivants : la première phase incluait deux ordinateurs Cray XC30, constitués chacun de 744 nœuds de calcul avec un total de 1 488 processeurs Intel® Xeon® à double connecteur avec un total de 93 To de mémoire principale, qui sont connectés via un réseau Cray Aries rapide avec topologie Dragonfly. La deuxième phase se traduisit par l'ajout de 2064 nœuds de calcul E5-2680 v3 de processeur Intel® Xeon® avec 85 248 cœurs, 1 872 nœuds de calcul à Berlin et 1 680 à Hanovre pour une performance maximale de 2,7 pétaflops/s et 222 To de mémoire principale étendue.