Des performances élevées pour les plates-formes de calcul intensif1 2 3

Des performances élevées pour les plates-formes de calcul intensif<sup>1</sup> <sup>2</sup> <sup>3</sup>

Des performances élevées pour les plates-formes de calcul intensif1 2 3

La nouvelle plate-forme d'Intel offre la capacité et la souplesse nécessaires pour réduire le besoin en systèmes dédiés exécutant du matériel et des logiciels spécialisés pour des charges de travail uniques. De plus, la 2e génération de processeurs Intel® Xeon® Scalable garantit des performances exceptionnelles à tous les niveaux : calcul, virgule flottante, deep learning, bande passante mémoire, ...technologies de plate-forme, densité et applications concrètes.

Processeurs évolutifs Intel® Xeon®

Optimisés en termes de charges de travail afin de gérer les applications exigeantes et d'obtenir des informations exploitables.

En savoir plus

Optimisez les performances du processeur et de la bande passante mémoire

La famille de systèmes serveurs Intel® S9200WK est un data center block offrant des performances optimisées et spécialement conçu pour les applications de calcul intensif (HPC) et d'IA.

En savoir plus

Des performances révolutionnaires pour vos défis concrets

De l'IA à l'analytique en passant par la simulation et la modélisation, la plate-forme de calcul intensif d'Intel offre des performances exceptionnelles en matière de mémoire, stockage, réseau et accélération pour relever vos plus grands défis.

En savoir plus

Vidéos associées

Infos sur le produit et ses performances

1

Amélioration multipliée par 30 du débit d'inférence sur le processeur Intel® Xeon® Platinum 9282 avec la technologie Intel® Deep Learning Boost (Intel® DL Boost) : Test réalisé par Intel le 26/02/2019. Plate-forme : processeur Intel® Xeon® Platinum 9282 2 sockets Dragon rock (56 cœurs par socket), technologie Hyper-Threading ACTIVÉE, technologie Turbo ACTIVÉE, 768 Go de mémoire totale (24 emplacements/32 Go/2 933 MHz), BIOS : SE5C620.86B.0D.01.0241.112020180249, noyau CentOS* 7 3.10.0-957.5.1.el7.x86_64, structure de Deep Learning : optimisation Intel® pour version Caffe* : https://github.com/intel/caffe d554cbf1, ICC 2019.2.187, MKL DNN version : v0.17 (hachage de validation : 830a10059a018cd2634d94195140cf2d8790a75a), modèle : https://github.com/intel/caffe/blob/master/models/intel_optimized_models/int8/resnet50_int8_full_conv.prototxt, BS=64, aucune couche de données syntheticData : 3x224x224, 56 instances/2 sockets, type de données : INT8 ; vs. test réalisé par Intel le 11 juillet 2017 : processeur Intel® Xeon® Platinum 8180 2 sockets à 2,50 GHz (28 cœurs), technologie Hyper-Threading désactivée, technologie Turbo désactivée, mode d'échelonnage réglé sur « performances » via le pilote intel_pstate, RAM ECC DDR4-2666 384 Go. CentOS* Linux version 7.3.1611 (Core), noyau Linux 3.10.0-514.10.2.el7.x86_64. Unité de stockage SSD : unité de stockage SSD Intel® DC série S3700 (800 Go, 2,5 pouces, SATA 6 Gbit/s, 25 nm, MLC). Performances mesurées avec les variables environnementales : KMP_AFFINITY='granularity=fine, compact‘, OMP_NUM_THREADS=56, fréquence du processeur réglée avec les performances cpupower frequency-set -d 2.5G -u 3.8G -g. Caffe : (http://github.com/intel/caffe/), révision f96b759f71b2281835f690af267158b82b150b5c. Inférence mesurée avec la commande « caffe time --forward_only », formation mesurée avec la commande « caffe time ». Un ensemble de données synthétique a été utilisé pour les topologies « ConvNet ». Pour les autres topologies, les données ont été stockées localement et mises en mémoire avant la formation. Spécifications des topologies sur https://github.com/intel/caffe/tree/master/models/intel_optimized_models (ResNet-50). Compilateur C++ Intel® ver. 17.0.2 20170213, Intel® Math Kernel Library (Intel® MKL) small libraries version 2018.0.20170425. Caffe exécuté avec « numactl -l ».

2

Performances Linpack 4 fois supérieures avec le processeur Intel® Xeon® Platinum 9242 de 2e génération par rapport au processeur AMD* EPYC* 7601 à grande échelle (4 nœuds, 8 nœuds).

Processeur Intel® Xeon® 9242 : 
plate-forme de référence Intel avec processeurs Intel® Xeon® 9242 à 2 sockets (2,2 GHz, 48 cœurs), 16 x 16 Go de mémoire DDR4-2933,1 unité de stockage SSD, système de fichiers cluster : 2.12.0-1 (serveur) 2.11.0-14.1 (client), BIOS : PLYXCRB1.86B.0572.D02.1901180818, microcode : 0x4000017, CentOS* 7.6, noyau : 3.10.0-957.5.1.el7.x86_64, pile OFED : OFED OPA 10.8 sur RH7.5 avec Lustre v2.10.4, HBA : architecture Intel® Omni-Path (Intel® OPA) 100 Gbit/s, PCIe* à port unique x16, commutateur Intel® OPA Edge série 100, 48 ports, HPL 2.1, Intel Compiler 2019u1, Intel® Math Kernel Library (Intel® MKL) 2019, MPI Intel 2019u1, HT= ACTIVÉ, Turbo= DÉSACTIVÉ, 2 threads par cœur, 4 nœuds = 20 408,00, 8 nœuds = 39 921 gf/s (le score le plus élevé étant le meilleur), test réalisé par Intel le 03/03/2019.

Processeur AMD EPYC 7601
 : Supermicro AS-2023US-TR4, processeur AMD EPYC 7601 à 2 sockets (2,2 GHz, 32 cœurs), 16 x 16 Go de mémoire DDR4-2666,1 unité de stockage SSD, BIOS version 1.1b (20/08/2018), version du microcode : 0x8001227, version du serveur Oracle* Linux 7.5 (3.10.0-862.14.4.el7.crt1.x86_64), système de fichiers cluster : Panasas (124 To de stockage) IEEL Lustre basé sur la version 5.5.0.b-1067797.15 EDR du micrologiciel, Mellanox EDR MT27700 100 Gbit/s, commutateur IB EDR Mellanox 36 ports, OFED MLNX mlnx-4.3-3.0.2.0, HPL 2.2, Intel Compiler 2018u3, AMD BLIS v0.4.0, MPI Intel 2018u3, SMT = ACTIVÉE, Turbo = ACTIVÉ, 2 threads par cœur, 4 nœuds = 4 739,96, 8 nœuds = 9 406.07 gf/s (le score le plus élevé étant le meilleur), test réalisé par Intel le 23/09/2018.

3

Les logiciels et charges de travail utilisés dans les tests de performance ont peut-être été optimisés uniquement pour les microprocesseurs Intel®. Les tests de performance tels que SYSmark* et MobileMark* portent sur des configurations, composants, logiciels, opérations et fonctions spécifiques. Les résultats peuvent varier en fonction de ces facteurs. Pour l'évaluation complète d'un produit, il convient de consulter d'autres tests et d'autres sources d'informations, notamment pour connaître le comportement de ce produit lorsqu'il est associé à d'autres composants. Pour plus d'informations, rendez-vous sur www.intel.fr/benchmarks.

Les résultats de performance s'appuient sur les tests réalisés aux dates indiquées dans les détails de configuration et peuvent ne pas refléter toutes les mises à jour de sécurité disponibles. Pour obtenir plus de détails, veuillez lire les informations de configuration. Aucun produit ou composant ne saurait être totalement sécurisé en toutes circonstances. Les fonctionnalités et avantages des technologies Intel® dépendent de la configuration du système et peuvent nécessiter du matériel et des logiciels compatibles, ou l'activation de services. Les résultats varient selon la configuration. Pour plus de détails, contactez le fabricant ou le vendeur de votre système ou rendez-vous sur intel.fr.