La HLRN dote le calcul intensif de performances avancées

Le HLRN a choisi les processeurs Intel® Xeon® Platinum 9200 pour répondre à ses besoins de plus en plus diversifiés en matière de charge de travail HPC.

Synthèse
Les supercalculateurs HLRN sont utilisés par plus de 100 universités et plus de 120 instituts de recherche, ce qui permet d'explorer les nombreux confins de la recherche scientifique afin de contribuer à la création d'un avenir meilleur. La sélection des dernières technologies de processeur Intel pour alimenter le dernier supercalculateur HLRN a été effectuée avoir mené des tests détaillés pour trouver la meilleure solution. Prof. Le Dr Ramin Yahyapour de l'Université de Göttingen explique que « l'acquisition du superordinateur du HLRN devait permettre d'augmenter considérablement la puissance des ordinateurs pour les nouvelles expériences ».

Défi
« La science en général est de plus en plus gourmande en calculs et en données. Cela signifie que le fait de disposer de systèmes plus importants se traduit par la possibilité pour les scientifiques de faire un meilleur travail. C'est pourquoi le HLRN est crucial pour la recherche scientifique », explique Prof. Ramin Yahyapour.

Le HLRN prétend être un client très exigeant, le HLRN dispose d'une grande expertise grâce à ses déploiements antérieurs de trois systèmes de superordinateurs. Prof. Alexander Reinefeld, de l'Institut Zuse de Berlin, souligne que « nous attendons les meilleures performances pour toutes les applications de référence. Notre ensemble de bancs d'essai a été soigneusement choisi de sorte que chaque code défie des parties spécifiques du système : CPU, réseau de communication et E/S parallèles. Nous ne recherchons pas une performance théorique de pointe, nous voulons une performance réelle du système, ce qui complique la tâche des fournisseurs qui doivent optimiser leur infrastructure pour nos applications. Cela signifie que notre sélection du bon processeur et de la bonne interconnexion sont toutes cruciales pour la performance globale ».

Comme c'est le cas dans le cadre de la plupart des recherches aujourd'hui, le besoin d'une plus grande capacité informatique dans le monde réel découle du fait que les chercheurs ont besoin de simulations de toutes sortes. Les ordinateurs plus rapides sont principalement utilisés pour augmenter la taille et la résolution de la simulation, dans l'espoir de faire de nouvelles découvertes.

« Nous exigeons une véritable performance du système... Ce qui signifie que notre sélection du bon processeur et de la bonne interconnexion sont toutes cruciales pour la performance globale ». — Prof. Reinefeld

Solution
Le HLRN est équipé d'un nouveau supercalculateur avec un peu moins d'un quart de million de cœurs. Les processeurs Intel® Xeon® Platinum 9200 (de la 2ème génération de processeurs Intel® Xeon® Scalable) serviront de « processeurs adéquats » pour le HLRN. Pour la « bonne interconnexion », le HLRN a choisi l'architecture Intel® Omni-Path (Intel® OPA). Le système est produit par Atos (anciennement Bull Computing) et sera physiquement partagé entre la Zuse-Institute Berlin (ZIB) et la Georg-August-Universität Göttingen (Université de Göttingen). Ces sites ont déjà utilisé ce modèle de systèmes à éléments séparés, et ont déjà mis en place un câble à fibre optique dédié et redondant de 10 gigabits couvrant les plus de 273 km entre Berlin et Göttingen.

Les chercheurs de la ZIB utiliseront le HLRN-IV pour la dynamique des fluides, notamment pour développer des modèles de turbulence pour les ailes des avions.

Résultat
Le HLRN a annoncé que le nouveau système, HLRN-IV, sera environ six fois plus rapide que les systèmes précédents, offrant une performance de 16 PetaFLOP/s. 1 L'enthousiasme des chercheurs est palpable, et la liste des recherches effectuées est ahurissante. Prof. Reinefeld a résumé son enthousiasme en disant : « C'est un excellent système. Nos utilisateurs bénéficieront immédiatement du système plus puissant sans avoir besoin de changer leur code. L'architecture homogène des processeurs Intel® Xeon® Scalable de deuxième génération permettra une véritable portabilité des performances. C'est un aspect crucial pour nos chercheurs afin de bénéficier rapidement de ce nouveau système plus puissant ».

Les principaux domaines de recherche au sein du HLRN sont les suivants :

  • La science du système terrestre - Ce qui inclut le travail sur le réchauffement climatique. Les sujets comprennent la dynamique des océans, des forêts tropicales, des glaciers, du phytoplancton antarctique (microalgues), des cycles des poussières minérales et de la stratosphère.
  • La dynamique des fluides - Qui inclut des modèles de turbulence pour les turbines de bateaux, les éoliennes et les ailes d'avions. Ces modèles sont connus pour nécessiter une énorme puissance de calcul. L'acquisition du HLRN-IV permettra d'effectuer des simulations de turbulences à grain plus fin sur de grands systèmes tels que le flux du vent dans une ville ou sur une pale d'une turbine. La modélisation de villes entières permettra d'étudier la façon dont les nouveaux bâtiments modifieraient le flux du vent, ainsi que d'autres facteurs qui ont un impact sur les différents microclimats de la ville. Cela peut conduire à concevoir de nouveaux aspects pour améliorer la vie en ville. D'autres chercheurs espèrent acquérir des connaissances qui ouvriront la voie aux futurs avions commerciaux de grande capacité. D'autres chercheurs espèrent sauver des vies et des navires en étudiant la liquéfaction de cargaisons solides en vrac (comme le minerai de fer ou de nickel). L'incapacité à traiter correctement cette question a entraîné la perte totale d'au moins sept navires dans le monde au cours de la dernière décennie.
  • La santé - est un vaste domaine de recherche et les chercheurs du HLRN espèrent y contribuer de nombreuses manières, notamment en améliorant les soins médicaux à domicile. Une meilleure compréhension des maladies et de leur traitement nous concerne tous. La recherche comprend des simulations de l'efficacité, des interactions et des effets secondaires des médicaments. Une puissance de calcul énorme permet aux chercheurs de pointe dans ces domaines de commencer à explorer les aspects de ces simulations concernant la « médecine personnalisée », et pas seulement les effets moyens sur une population générale.

À l'université de Göttingen, les domaines de recherche comprennent des projets de collaboration sur les machines cellulaires et moléculaires.

Haute performance dans un ensemble de recherches diversifié
Du point de vue des différentes communautés scientifiques, le HLRN doit supporter tous les types de charges de travail pour ses nombreux chercheurs. Par conséquent, les systèmes HLRN doivent présenter les caractéristiques d'un système à usage général tout en offrant les meilleures performances. Leur choix final ne comportait aucun accélérateur.

« Bien que nous ayons examiné les accélérateurs, y compris les GPU, dans le cadre du processus d'achat, il n'y avait aucun avantage à obtenir les meilleures performances en utilisant les GPU ou d'autres accélérateurs dans le système » - Dr. Thomas Steinke, chef du département de calcul intensif de la ZIB

Les points de référence du HLRN sont ouverts et comprennent des points de référence qui peuvent tirer parti des GPU. Le HLRN a constaté que tout avantage de performance sur certaines charges de travail est insuffisant, si l'on considère la réduction de la capacité de calcul à usage général, ou les coûts supplémentaires que cela implique. Un système homogène basé sur les processeurs Intel® Xeon® Scalable de deuxième génération s'est révélé être le meilleur choix pour les divers besoins des scientifiques et des chercheurs du HLRN.

Battre en brèche la loi d'Amdahl
Le Dr Thomas Steinke, toujours soucieux de la loi d'Amdahl, aime mettre l'accent sur l'utilisation d'algorithmes rapides pour des ordinateurs rapides. Il a déclaré que « la pression de l'optimisation du code pour la mise à l'échelle sur un nœud est moindre en raison des performances réelles élevées des processeurs Intel® Xeon® Scalable de 2ème génération par rapport aux précédentes architectures à plusieurs cœurs ».

La famille de processeurs Intel® Xeon® Scalable de deuxième génération offre un choix exceptionnel pour le calcul haute performance (HPC) et aide les programmeurs à faire face à la loi d'Amdahl.

« Nos utilisateurs bénéficieront immédiatement du système plus puissant sans avoir besoin de changer leur code. » - Prof. Reinefeld

L'avenir de l'IA dans le HPC
L'IA et l'apprentissage automatique devraient impacter tous les domaines de recherche du HLRN. Un domaine d'intérêt majeur est le mélange de l'apprentissage automatique et des techniques d'IA avec les capacités de simulation traditionnelles. Si des résultats prometteurs ont été signalés, il reste encore beaucoup à faire. L'exploration des algorithmes est susceptible de mener les chercheurs dans de nombreuses directions, et ce besoin de flexibilité est l'une des raisons pour lesquelles le HLRN a choisi des processeurs Intel® Xeon® Scalable de deuxième génération pour soutenir sa prochaine génération de recherche.

Éviter le mouvement des données
Prof. Yahyapour a souligné que « le processeur est assez bon pour l'intelligence artificielle et l'apprentissage automatique. C'est un domaine dans lequel nous constatons un besoin accru de la part de nos chercheurs. Ils n'étaient traditionnellement pas réellement intéressés par le travail à forte intensité de données, mais c'est une nouvelle tendance pour le nouveau système qui sera également d'un intérêt tout particulier ».

Intel® Advanced Vector Extensions 512 (Intel® AVX-512) s'est avéré être le choix logique pour aider à augmenter la puissance de calcul du HLRN. Avec l'ajout d'Intel® Deep Learning Boost (Intel® DL Boost) pour augmenter l'AVX-512, il a offert des performances exceptionnelles pour ces nouvelles applications HPC.

La possibilité de calculer les données où qu'elles se trouvent, pour tous les types d'algorithmes, permet d'éviter le déplacement des données. Cela représente une augmentation de la capacité de calcul, et moins de gaspillage d'énergie. Une double victoire !

Lors de l'exploration de nouveaux algorithmes et de nouvelles techniques d'application, rien n'est plus important que la flexibilité d'un système. Le processeur Intel® Xeon® Scalable de deuxième génération offre des performances élevées associées à la flexibilité nécessaire pour relever les défis futurs.

Explorer les produits Intel® associés

Processeurs Intel® Xeon® Scalable

Générez des données exploitables, faites confiance à la sécurité assistée par matériel et mettez en place des prestations de services dynamiques avec les processeurs Intel® Xeon® Scalable.

En savoir plus

Intel® Deep Learning Boost (Intel® DL Boost)

Les processeurs Intel® Xeon® Scalable font franchir un nouveau seuil de performances aux applications d'IA grâce à Intel® Deep Learning Boost (Intel® DL Boost).

En savoir plus

Architecture Intel® Omni-Path (Intel® OPA)

L'architecture Intel® Omni-Path (Intel® OPA) diminue le TCO des systèmes tout en améliorant la fiabilité, en offrant des performances élevées et une évolutivité extrême.

En savoir plus

Avis et avertissements

Les fonctionnalités et avantages des technologies Intel® dépendent de la configuration du système et peuvent nécessiter du matériel et des logiciels compatibles et l'activation de certains services. Les performances varient d'une configuration à une autre. Aucun ordinateur ne saurait être totalement sécurisé. Consultez le constructeur ou le revendeur de votre ordinateur.vous pouvez consulter le site https://www.intel.fr pour en savoir plus. // Les logiciels et charges de travail utilisés dans les tests de performance ont peut-être été optimisés uniquement pour les microprocesseurs Intel®. Les tests de performance tels que SYSmark et MobileMark portent sur des configurations, composants, logiciels, opérations et fonctions spécifiques. Les résultats peuvent varier en fonction de ces facteurs. Pour l'évaluation d'un produit, il convient de consulter d'autres tests et d'autres sources d'information, notamment pour connaître le comportement de ce produit avec d'autres composants. Pour des informations plus complètes, visitez https://www.intel.fr/benchmarks. // Les résultats de performances s'appuient sur les tests réalisés aux dates indiquées dans les configurations et peuvent ne pas refléter toutes les mises à jour de sécurité disponibles. Pour obtenir plus de détails, veuillez lire les informations de configuration. Aucun produit ou composant ne saurait être totalement sécurisé. // Les scénarios de réduction de coûts décrits sont fournis à titre d'exemples montrant comment un produit de technologie Intel® donné, dans les circonstances et configurations spécifiées, peut affecter les coûts futurs et entraîner des économies de coûts. Les circonstances peuvent varier selon les cas. Intel ne garantit aucun coût ni réduction de coûts. // Intel ne maîtrise et ne vérifie pas les bancs d'essai cités ici ou sur les sites Web mentionnés en référence. Vous êtes invité à consulter vous-même ces sites Web et à vérifier l'exactitude des données. // Dans certains cas, les résultats ont été estimés ou simulés à l'aide d'une analyse, d'une simulation ou d'une modélisation d'architecture réalisée en interne par Intel et sont mentionnés à titre indicatif. Toute différence matérielle, logicielle ou de configuration du système peut avoir une incidence sur vos performances effectives.

Infos sur le produit et ses performances

1

Le système précédent, HLRN-III, se compose de deux complexes situés chez ZIB à Berlin et Leibniz Universität Services (LUIS) à Hanovre associés à une connexion fibre optique de 10GigE pour permettre à HLRN d'offrir son point de vue à système unique. Les détails des nœuds de calcul, fournis en deux phases, comprennent les éléments suivants : la première phase incluait deux ordinateurs Cray XC30, constitués chacun de 744 nœuds de calcul avec un total de 1 488 processeurs Intel® Xeon® à double connecteur avec un total de 93 To de mémoire principale, qui sont connectés via un réseau Cray Aries rapide avec topologie Dragonfly. La deuxième phase se traduisit par l'ajout de 2064 nœuds de calcul E5-2680 v3 de processeur Intel® Xeon® avec 85 248 cœurs, 1 872 nœuds de calcul à Berlin et 1 680 à Hanovre pour une performance maximale de 2,7 pétaflops/s et 222 To de mémoire principale étendue.