La performance par le partenariat

En sa qualité de leader de l'industrie du calcul intensif (HPC), Intel s'associe à des fournisseurs de logiciels comme Ansys, Altair, Quantifi et Dassault, tout en fournissant une expertise et des ressources en marketing et en ingénierie. Ces relations permettent de garantir que les solutions HPC populaires tirent pleinement parti des capacités matérielles et logicielles Intel®. Les clients finaux bénéficient ainsi d'une puissance, de performances et de tarifs exceptionnels.

Segments cibles du HPC

Les applications HPC des éditeurs de logiciels tirent parti des processeurs Intel® Xeon® Scalable, dont les performances ont fait leurs preuves1 et la plus grande bande passante mémoire disponible de tous les processeurs HPC.2 Ces améliorations, combinées aux capacités mémoire et de stockage révolutionnaires de la technologie Intel® Optane™, permettent de prendre en charge les charges de travail gourmandes en calcul et en stockage pour les cas d'utilisation HPC avancés dans de nombreux segments.

Infos sur le produit et ses performances

1HPCG: Platinum 8358 : 1 noeud, 2x processeur Intel® Xeon® Platinum 8358 (32C/2,6 GHz, 250W TDP) sur Intel Software Development Platform avec 256 Go de mémoire DDR4 totale (16 emplacements/ 16 Go/ 3 200), ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_​3.crt1.x86_​64, 1x Intel_​SSDSC2KG96, Version de l'appli : 2019u5 MKL ; Notes de Build : Outils : Intel MKL 2020u4, Compileur Intel C 2020u4, Intel MPI 2019u8 ; threads/cœurs : 1 ; Turbo : utilisé ; Boutons de Build : -O3 -ip -xCORE-AVX512. EPYC 7543 : 1 nœud, 2 socket AMD EPYC 7543 (32C/2,8 GHz, 240 W cTDP) sur serveur Dell PowerEdge R7525 avec 1 024 Go de mémoire DDR4 totale (16 emplacements / 64 Go/3 200), ucode 0xa0119, SMT on, Boost on, mode Power deterministic, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, Version de l'appli : 2019u5 MKL ; Notes de Build : Outils : Intel MKL 2020U4, Compileur Intel C 2020u4, Intel MPI 2019u8 ; threads/core : 1 ; Turbo : utilisé ; boutons de Build : -O3 -ip -march=core-avx2, testé par Intel et résultats en date d'avril 2021. HPL : Platinum 8358 : 1 nœud, 2x processeur Intel® Xeon® Platinum 8358 (32C/2,6 GHz, 250 TDP) sur Intel Software Development Platform avec 256 Go de mémoire DDR4 totale (16 emplacements / 16 Go / 3 200), ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_​3.crt1.x86_​64, 1x Intel_​SSDSC2KG96, Version de l'appli : la distribution Intel pour banc d'essai LINPACK ; Notes de Build : Outils : Intel MPI 2019u7 ; threads/core : 1 ; Turbo : utilisé ; Build : script de build de la distribution Intel pour banc d'essai LINPACK ; 1 rang par nœud NUMA : 1 rang par socket, EPYC 7543 : 1 nœud, 2 socket AMD EPYC 7543 (32C/2,8 GHz, 240W cTDP) sur serveur Dell PowerEdge R7525 avec 1 024 Go de mémoire DDR4 totale (16 emplacements / 64 Go / 3 200), ucode 0xa001119, SMT on, Boost on, mode Power deterministic, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, Version de l'appli : AMD official HPL version 2.3 MT avec BLIS 2.1 ; Notes de Build : Outils : hpc-x 2.7.0 ; threads/core : 1 ; Turbo : utilisé ; Build : binaire préconstruit (gcc built) de https://developer.amd.com/amd-aocl/blas-library/ ; 1 rang par cache L3, 4 threads par rang, testé par Intel et résultats en date d'avril 2021. STREAM Triad : Platinum 8358 : 1 nœud, 2x processeur Intel® Xeon® Platinum 8358 (32C/2,6 GHz, 250W TDP) sur Intel Software Development Platform avec 256 Go de mémoire DDR4 totale (16 emplacements / 16 Go/ 3 200), ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_​3.crt1.x86_​64, 1x Intel_​SSDSC2KG96, Version de l'appli : McCalpin_​STREAM_​OMP-version ; Notes de Build : Outils : Compileur Intel C 2019u5 ; threads/core : 1 ; Turbo : utilisé ; Paramètres du BIOS : HT=on Turbo=On SNC=On. EPYC 7543 : 1 nœud, 2 socket AMD EPYC 7543 (32C/2,8 GHz, 240 W cTDP) sur serveur Dell PowerEdge R7525 avec 1 024 Go de mémoire DDR4 totale (16 emplacements / 64 Go / 3 200), ucode 0xa0119, SMT on, Boost on, mode Power deterministic, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, Version de l'appli : McCalpin_​STREAM_​OMP-version ; Notes de Build : Outils : Compileur Intel C 2019u5 ; threads/core : 1 ; Turbo : utilisé ; Paramètres du BIOS : HT=on Turbo=On SNC=On, testé par Intel et résultats en date d'avril 2021. Moyenne géométrique WRF de Conus-12km, Conus-2.5km, NWSC-3 NA-3km : Platinum 8358 : 1 nœud 2x processeur Intel® Xeon® Platinum 8358 (32C/2,6 GHz, 250W TDP) sur Intel Software Development Platform avec 256 Go (16 emplacements / 16 Go/ 3 200) de mémoire DDR4 totale, ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_​3.crt1.x86_​64, 1x Intel_​SSDSC2KG96, Version de l'appli : 4.2.2 ; Notes de Build : Compileur Intel Fortran 2020u4, Intel MPI 2020u4 ; threads/core : 1 ; Turbo : utilisé ; Boutons de Build :-ip -w -O3 -xCORE-AVX2 -vec-threshold0 -ftz -align array64byte -qno-opt-dynamic-align -fno-alias $(FORMAT_​FREE) $(BYTESWAPIO) -fp-model fast=2 -fimf-use-svml=true -inline-max-size=12000 -inline-max-total-size=30000. EPYC 7543 : 1 nœud, 2 socket AMD EPYC 7543 (32C/2,8 GHz, 240 W cTDP) sur serveur Dell PowerEdge R7525 avec 1 024 Go de mémoire DDR4 totale (16 emplacements / 64 Go /3 200), ucode 0xa0119, SMT on, Boost on, mode Power deterministic, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, Version de l'appli : 4.2.2 ; Notes de Build : Compileur Intel Fortran 2020u4, Intel MPI 2020u4 ; threads/core : 1 ; Turbo : utilisé ; Boutons de Build : -ip -w -O3 -march=core-avx2 -ftz -align all -fno-alias $(FORMAT_​FREE) $(BYTESWAPIO) -fp-model fast=2 -inline-max-size=12000 -inline-max-total-size=30000, testé par Intel et résultats en date d'avril 2021. Options binomiales : Platinum 8358 : 1 noeud, 2x processeur Intel® Xeon® Platinum 8358 (32C/2,6 GHz, 250W TDP) sur Intel Software Development Platform avec 256 Go de mémoire DDR4 totale (16 emplacements / 16 Go / 3 200), ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_​3.crt1.x86_​64, 1x Intel_​SSDSC2KG96, Version de l'appli : v1.0 ; Notes de Build : Outils : Compileur Intel C 2020u4, Intel Threading Building Blocks ; threads/core : 2 ; Turbo : utilisé ; Boutons de Build : -O3 -xCORE-AVX512 -qopt-zmm-usage=high -fimf-domain-exclusion=31 -fimf-accuracy-bits=11 -no-prec-div -no-prec-sqrt. EPYC 7543 : 1 nœud, 2 socket AMD EPYC 7543 (32C/2,8 GHz, 240 W cTDP) sur serveur Dell PowerEdge R7525 avec 1 024 Go de mémoire DDR4 totale (16 emplacements / 64 Go /3 200), ucode 0xa0119, SMT on, Boost on, mode Power deterministic, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, Version de l'appli : v1.0 ; Notes de Build : Outils : Compileur Intel C 2020u4, Intel Threading Building Blocks ; threads/core : 2 ; Turbo : utilisé ; boutons de Build : -O3 -march=core-avx2 -fimf-domain-exclusion=31 -fimf-accuracy-bits=11 -no-prec-div -no-prec-sqrt, testé par Intel et résultats en date d'avril 2021. Monte Carlo : Platinum 8358 : 1 nœud, 2x processeur Intel® Xeon® Platinum 8358 (32C/2,6 GHz, 250W TDP) sur Intel Software Development Platform avec 256 Go de mémoire DDR4 totale (16 emplacements / 16 Go / 3 200), ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_​3.crt1.x86_​64, 1x Intel_​SSDSC2KG96, Version de l'appli : v1.1 ; Notes de Build : Outils : Intel MKL 2020u4, Compileur Intel C 2020u4, Intel Threading Building Blocks 2020u4 ; threads/core : 1 ; Turbo : utilisé ; Boutons de Build : -O3 -xCORE-AVX512 -qopt-zmm-usage=high -fimf-precision=low -fimf-domain-exclusion=31 -no-prec-div -no-prec-sqrt. EPYC 7543 : 1 noeud, 2 socket AMD EPYC 7543 (32C/2,8 GHz, 240W cTDP) sur serveur Dell PowerEdge R7525 avec 1 024 Go de mémoire DDR4 totale (16 emplacements / 64 Go / 3 200), ucode 0xa001119, SMT on, Boost on, mode Power deterministic, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, Version de l'appli : v1.1 ; Notes de Build : Outils : Intel MKL 2020u4, Compileur Intel C 2020u4, Intel Threading Building Blocks 2020u4 ; threads/core : 2 ; Turbo : utilisé ; Boutons de Build : -O3 -march=core-avx2 -fimf-precision=low -fimf-domain-exclusion=31 -no-prec-div -no-prec-sqrt, testé par Intel et résultats en date d'avril 2021. Moyenne géométrique Ansys Fluent d'aircraft_​wing_​14m, aircraft_​wing_​2m, combustor_​12m, combustor_​16m, combustor_​71m, exhaust_​system_​33m, fluidized_​bed_​2m, ice_​2m, landing_​gear_​15m, oil_​rig_​7m, pump_​2m, rotor_​3m, sedan_​4m : Platinum 8358 : 1 nœud, 2x processeur Intel® Xeon® Platinum 8358 (32C/2,6 GHz, 250W TDP) sur Intel Software Development Platform avec 256 Go de mémoire DDR4 totale (16 emplacements / 16 Go/ 3 200), ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_​3.crt1.x86_​64, 1x Intel_​SSDSC2KG96, Version de l'appli : 2021 R1 ; Notes de Build : Un thread par core ; Multi-threading activé ; Turbo Boost activé ; Turbo Boost activé ; Compileur Intel FORTRAN 19.5.0 ; Compileur Intel C/C++ 19.5.0 ; Intel Math Kernel Library 2020.0.0 ; Intel MPI Library 2019 Update 8. EPYC 7543 : 1 noeud, 2 socket AMD EPYC 7543 (32C/2,8 GHz, 240W cTDP) sur serveur Dell PowerEdge R7525 avec 1 024 Go de mémoire DDR4 totale (16 emplacements / 64 Go/ 3 200), ucode 0xa001119, SMT on, Boost on, mode Power deterministic, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, Version de l'appli : 2021 R1 ; Notes de Build : Un thread par core ; Multi-threading activé ; Turbo Boost activé ; Compileur Intel FORTRAN 19.5.0 ; Compileur Intel C/C++ 19.5.0 ; Intel Math Kernel Library 2020.0.0 ; Intel MPI Library 2019 Update 8, testé par Intel et résultats en date d'avril 2021. Mesure géométrique LS-DYNA Ansys de car2car-120ms, ODB_​10M-30ms: Platinum 8358: 1 noeud, 2x processeur Intel® Xeon® Platinum 8358 (32C/2,6 GHz, 250W TDP) sur Intel Software Development Platform avec 256 Go de mémoire DDR4 totale (16 emplacements / 16 Go/ 3 200), ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_​3.crt1.x86_​64, 1x Intel_​SSDSC2KG96, Version de l'appli : R11 ; Notes de Build : Outils : Compileur Intel 2019u5 (AVX512), Intel MPI 2019u9 ; threads/core : 1 ; Turbo : utilisé. EPYC 7543 : 1 nœud, 2 socket AMD EPYC 7543 (32C/2,8 GHz, 240 W cTDP) sur serveur Dell PowerEdge R7525 avec 1 024 Go de mémoire DDR4 totale (16 emplacements / 64 Go / 3 200), ucode 0xa0119, SMT on, Boost on, mode Power deterministic, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, Version de l'appli : R11 ; Notes de Build : Outils : Compileur Intel C 2019u5 (AMDAVX2), Intel MPI 2019u9 ; threads/core : 1 ; Turbo : utilisé, testé par Intel et résultats en date d'avril 2021. OpenFOAM 42M_​motorbike : Platinum 8358 : 1 nœud, 2x processeur Intel® Xeon® Platinum 8358 (32C/2,6 GHz, 250W TDP) sur Intel Software Development Platform avec 256 Go de mémoire DDR4 totale (16 emplacements / 16 Go / 3 200), ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.el8_​3.crt1.x86_​64, 1x Intel_SSDSC2KG96, Version de l'appli : v8 ; Notes de Build : Outils : Compileur Intel FORTRAN 2020u4, Compileur Intel C 2020u4, Intel MPI 2019u8 ; threads/core : 1 ; Turbo : utilisé : Boutons de Build : -O3 -ip -xCORE-AVX512. EPYC 7543 : 1 nœud, 2 socket AMD EPYC 7543 (32C/2,8 GHz, 240 W cTDP) sur serveur Dell PowerEdge R7525 avec 1 024 Go de mémoire DDR4 totale (16 emplacements / 64 Go / 3 200), ucode 0xa0119, SMT on, Boost on, mode Power deterministic, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, Version de l'appli : v8 ; Notes de Build : Outils : Compileur Intel FORTRAN 2020u4, Compileur Intel C 2020u4, Intel MPI 2019u8 ; threads/core : 1 ; Turbo : utilisé ; boutons de Build : -O3 -ip -march=core-avx2, testé par Intel et résultats en date d'avril 2021. Moyenne géométrique LAMMPS du Polyethylene, Stillinger-Weber, Tersoff, Water : Platinum 8358 : 1 nœud, 2x processeur Intel® Xeon® Platinum 8358 (32C/2,6 GHz, 250W TDP) sur Intel Software Development Platform avec 256 Go de mémoire DDR4 totale (16 emplacements / 16 Go / 3200), ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_​3.crt1.x86_​64, 1x Intel_​SSDSC2KG96, Version de l'appli : v2020-10-29 ; Notes de Build : : Outils : Intel MKL 2020u4, Compileur Intel C 2020u4, Intel Threading Building Blocks 2020u4, Intel MPI 2019u8 ; threads/core : 2 ; Turbo : utilisé ; Boutons de Build : -O3 -ip -xCORE-AVX512 -qopt-zmm-usage=high. EPYC 7543 : 1 nœud, 2 socket AMD EPYC 7543 (32C/2,8 GHz, 240 W cTDP) sur serveur Dell PowerEdge R7525 avec 1 024 Go de mémoire DDR4 totale (16 emplacements / 64 Go/3 200), ucode 0xa0119, SMT on, Boost on, mode Power deterministic, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, Version de l'appli : v2020-10-29 ; Notes de Build : Outils : Intel MKL 2020u4, Compileur Intel C 2020u4, Intel Threading Building Blocks 2020u4, Intel MPI 2019u8 ; threads/core : 2 ; Turbo : utilisé ; Boutons de Build : --O3 -ip -march=core-avx2, testé par Intel et résultats en date d'avril 2021. Moyenne géométrique NAMD d'Apoa1, STMV: Platinum 8358 : 1 nœud, 2x processeur Intel® Xeon® Platinum 8358 (32C/2,6 GHz, 250W TDP) sur Intel Software Development Platform avec 256 Go de mémoire DDR4 totale (16 emplacements / 16 Go / 3200), ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_​3.crt1.x86_​64, 1x Intel_​SSDSC2KG96, Version de l'appli : 2.15-Alpha1 (inclut l'algorithme de tuiles AVX) ; Notes de Build : Outils : Intel MKL, Compileur Intel C 2020u4, Intel MPI 2019u8, Intel Threading Building Blocks 2020u4 ; threads/core : 2 ; Turbo : utilisé ; Boutons de Build : -ip -fp-model fast=2 -no-prec-div -qoverride-limits -qopenmp-simd -O3 -xCORE-AVX512 -qopt-zmm-usage=high. EPYC 7543 : 1 nœud, 2 socket AMD EPYC 7543 (32C/2,8 GHz, 240W cTDP) sur serveur Dell PowerEdge R7525 avec 1 024 Go de mémoire DDR4 totale (16 emplacements / 64 Go / 3200), ucode 0xa001119, SMT on, Boost on, mode Power deterministic, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, Version de l'appli : 2.15-Alpha1 (inclut l'algorithme de tuiles AVX) ; Notes de Build : Outils : Intel MKL, AOCC 2.2.0, gcc 9.3.0, Intel MPI 2019u8 ; threads/core : 2 ; Turbo : utilisé ; Boutons de Build : -O3 -fomit-frame-pointer -march=znver1 -ffast-math, testé par Intel et résultats en date d'avril 2021. RELION Plasmodium Ribosome : Platinum 8358 : 1 nœud, 2x processeur Intel® Xeon® Platinum 8358 (32C/2,6 GHz, 250W TDP) sur Intel Software Development Platform avec 256 Go de mémoire DDR4 totale (16 emplacements / 16 Go / 3 200), ucode 0x261, HT on, Turbo on, CentOS Linux 8.3.2011, 4.18.0-240.1.1.el8_​3.crt1.x86_​64, 1x Intel® SSDSC2KG96, Version de l'appli : 3_​1_​1 ; Notes de Build : Outils : Compileur Intel C 2020u4, Intel MPI 2019u9 ; threads/core : 2 ; Turbo : utilisé ; Boutons de Build : -O3 -ip -g -debug inline-debug-info -xCOMMON-avX512 -qopt-report=5 –restrict. EPYC 7543 : 1 nœud, 2 socket AMD EPYC 7543 (32C/2,8 GHz, 240W cTDP) sur serveur Dell PowerEdge R7525 avec 1 024 Go de mémoire DDR4 totale (16 emplacements / 64 Go / 3 200), ucode 0xa001119, SMT on, Boost on, mode Power deterministic, NPS=4, Red Hat Enterprise Linux 8.3, 4.18, 2x Micron 5300 Pro, Version de l'appli : 3_​1_​1 ; Notes de Build : Outils : Compileur Intel C 2020u4, Intel MPI 2019u9 ; threads/core : 2 ; Turbo : utilisé ; Boutons de Build : -O3 -ip -g -debug inline-debug-info -march=core-avx2 -qopt-report=5 -restrict, testé par Intel et résultats en date d'avril 2021.
2Plus grande bande passante mémoire disponible de tous les processeurs HPC (9200) avec 12 canaux DDR4 pour alimenter les charges de travail liées à la mémoire. Depuis le 21 juillet 2021, Intel propose jusqu'à 12 canaux de mémoire DDR4 pour les processeurs Intel® Xeon®, contre 8 pour AMD EPYC.
3Performances d'inférence IA par lot 11 fois supérieures avec Tensor Flow optimisé par Intel par rapport à la configuration FP32 Cascade Lake standard Nouveau : 8380 : 1 noeud, 2x processeur Intel Xeon Platinum 8380 sur Coyote Pass avec 512 Go de mémoire DDR4 totale (16 emplacements / 32 Go / 3 200), ucode X261, HT on, Turbo on, Ubuntu 20.04 LTS, 5.4. 0-65-générique, 1x Intel_SSDSC2KG96, Intel SSDPE2KX010T8, ResNet-50 v1.5, gcc-9.3.0, oneDNN 1.6.4, BS=128 FP32,INT8, TensorFlow 2.4.1 avec optimisations Intel pour processeur Intel Xeon Scalable de 3ᵉ génération, en amont de TensorFlow- 2. 5 (container- intel/intel-optimized-tensorflow:tf-r2.5-icx-b631821f), Modèle zoo : https://github.com/IntelAI/models/tree/icx-launch-public/quickstart/, Modèle non optimisé : TensorFlow- 2.4.1, Modelzoo:https://github.com/IntelAI/models -b master, testé par Intel le 3/12/2021. Ligne de référence : 8280 : 1 nœud, 2 processeurs Intel Xeon Platinum 8280 sur Wolf Pass avec 384 GB (12 slots/ 32GB/ 2933) de mémoire DDR4 totale, ucode 0x5003003, HT on, Turbo on, Ubuntu 20. 04 LTS, 5.4.0-48-generic, 1x Samsung_SSD_860, Intel SSDPE2KX040T8, ResNet-50 v1.5, gcc-9.3.0, oneDNN 1.6.4, BS=128 FP32,INT8, Modèle optimisé : TensorFlow 2.4. 1 avec optimisations Intel pour processeur Intel Xeon Scalable de 3ᵉ génération, en amont de TensorFlow- 2.5 (container- intel/intel-optimized-tensorflow:tf-r2.5-icx-b631821f), Model zoo : https://github.com/IntelAI/models/tree/icx-launch-public/quickstart/, Modèle non optimisé : TensorFlow- 2.4.1, Modelzoo:https://github.com/IntelAI/models -b master, testé par Intel le 17/02/2021