Performances de GROMACS sur des instances Intel sur AWS

Pourquoi choisir Intel pour le HPC dans le Cloud

  • Partenariats technologiques avec les principaux fournisseurs de composants pour garantir l'optimisation des processeurs Intel®.

  • Des collaborations étroites entre les éditeurs de logiciels indépendants et la communauté du calcul intensif, axées sur l'optimisation des principaux codes de calcul intensif.

  • Évolutivité et flexibilité pour des charges de travail variables dans l'environnement Cloud.

author-image

Par

Instances Intel pour les charges de travail de calcul intensif

Les tests ci-dessous ont été réalisés sur des instances AWS basées sur différentes générations de processeurs Intel® Xeon® dans une configuration hyperthreadée. Ce processeur personnalisé peut atteindre une fréquence d'horloge turbo sur tous les cœurs allant jusqu'à 3,5 GHz et dispose de la technologie Intel® Turbo Boost 2.0, d'Intel® Advanced Vector Extensions 512 (Intel® AVX-512) et d'Intel® Deep Learning Boost. Ces nouvelles offres apportent une meilleure proposition de valeur pour les charges de travail polyvalentes et à forte intensité de mémoire par rapport à la génération précédente (p. ex., une évolutivité accrue et une classe de processeurs améliorée), sans oublier de meilleures performances.

Qu'est-ce que GROMACS ?

L'application GROMACS est une application liée au calcul (FLOPS). Les charges de travail de cette application sont sensibles à la latence pour toute communication (socket-socket, processeur graphique et multi-nœuds). Elle bénéficie des avantages d'AVX-512 (Y), des avantages liés au calcul (Y) (à l'exception d’ionchannel, lié à MPI sur 8 à 16 nœuds), des avantages de Turbo (Y), des avantages de HT/SMT (Y).

Les charges de travail que nous avons considérées pour notre banc d'essai sont disponibles publiquement :

  • lignocellulose (3 M d'atomes, type RF) ; la lignocellulose est utile comme exemple de démonstration d'évolutivité.
  • water_rf (1,5 M d'atomes, type RF)

Voir ci-dessous pour connaître les charges de travail et les configurations. Les résultats effectifs peuvent varier.

Configuration de C6i.32 xlarge - Processeur Intel® Xeon® Scalable de 3ᵉ génération à 2,9 GHz, capacité de mémoire de 256 Go, bande passante réseau de 50 Gbit/s, noyau CentOS Linux 7 de la version 3.10.0-1160.45.1.el7.x86_64, GROMACS version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library pour Linux OS, version 2021.4 Build 20210831 (id : 758087adf), testé par Intel le 09/11/2021

Configuration de C5n.18xlarge - Processeur Intel® Xeon® Scalable à 2,9 GHz, 192 Go de mémoire, bande passante réseau de 100 Gbit/s, noyau CentOS Linux 7 de la version 3.10.0-1160.45.1.el7.x86_64, GROMACS version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library pour Linux OS, version 2021.4 Build 20210831 (id : 758087adf), testée par Intel le 09/11/2021

Configuration de M6i.32 xlarge - Processeur Intel® Xeon® Scalable de 3ᵉ génération à 2,9 GHz, 512 Go de mémoire, bande passante réseau de 50 Gbit/s, noyau CentOS Linux 7 de la version 3.10.0-1160.45.1.el7.x86_64, GROMACS version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library pour Linux OS, Version 2021.4 Build 20210831 (id : 758087adf), testée par Intel le 09/11/2021

Voir ci-dessous pour connaître les charges de travail et les configurations. Les résultats effectifs peuvent varier.

Configuration de C6i.32 xlarge - Processeur Intel® Xeon® Scalable de 3ᵉ génération à 2,9 GHz, capacité de mémoire de 256 Go, bande passante réseau de 50 Gbit/s, noyau CentOS Linux 7 de la version 3.10.0-1160.45.1.el7.x86_64, GROMACS version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library pour Linux OS, version 2021.4 Build 20210831 (id : 758087adf), testé par Intel le 09/11/2021

Configuration de C5n.18xlarge - Processeur Intel® Xeon® Scalable à 2.9 GHz, 192 Go de mémoire, bande passante réseau de 100 Gbit/s, noyau CentOS Linux 7 de la version 3.10.0-1160.45.1.el7.x86_64, GROMACS version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library pour Linux OS, version 2021.4 Build 20210831 (id : 758087adf), testée par Intel le 09/11/2021

Configuration de M6i.32 xlarge - Processeur Intel® Xeon® Scalable de 3ᵉ génération à 2,9 GHz, 512 Go de mémoire, bande passante réseau de 50 Gbit/s, noyau CentOS Linux 7 de la version 3.10.0-1160.45.1.el7.x86_64, GROMACS version 2021.3, icc 2021.4.0 20210910, Intel® MPI Library pour Linux OS, Version 2021.4 Build 20210831 (id : 758087adf), testée par Intel le 09/11/2021

Comment bénéficier des avantages d'Intel

Les processeurs Intel Xeon Scalable de 3ᵉ génération offrent des gains de performances significatifs pour la charge de travail GROMACS, qui est accéléréé par les technologies Intel AVX-512 et Intel Deep Learning Boost. Cette accélération offre des avantages significatifs lorsque le nombre de nœuds est faible (supérieur à 2). Elle devient plus limitée lorsque nous passons à un nombre de nœuds plus important, en raison de la bande passante réseau plus faible de C6i.32xlarge et M6i.32xlarge. Les clients exécutant cette charge de travail GROMACS peuvent réaliser des gains de performance significatifs en la déployant sur des types d'instance Intel Xeon Scalable de 3ᵉ génération sur AWS (M6i, C6i) par rapport à l'exécution sur des processeurs Intel Xeon Scalable de génération précédente sur AWS.
Ressources : www.intel.fr/HPC