Infos sur le produit et ses performances
1Des performances de formation de l'IA jusqu'à 1,93 fois supérieures avec un processeur Intel Xeon Scalable de 3ᵉ génération prenant en charge Intel DL Boost avec BF16 par rapport à un processeur de génération précédente avec un débit ResNet-50 pour la classification d'images.
Nouvelle configuration : 1 nœud, 4 processeurs Intel Xeon Platinum 8380H de 3ᵉ génération (pré-production 28 cœurs, 250 W) avec 384 Go de mémoire totale (24 x 16 Go, 3 200 GHz), SSD Intel de 800 Go, ResNet-50 v1.5, ucode 0x70001b, technologie Intel Hyper-Threading (Intel HT) activée, technologie Intel Turbo Boost activée, et exécutant Ubuntu 20.04 LTS, Linux 5.4.0-26,28,29-generic. Débit :
https://github.com/Intel-tensorflow/tensorflow -b bf16/base, commit#828738642769358b388d8f615ded9c213f10c99a, Model Zoo :
https://github.com/IntelAI/models -b v1.6.1, ImageNet dataset, oneDNN 1.4, BF16, BS=512, testée par Intel le 18/05/2020.
Référence : 1 nœud, 4 processeurs Intel Xeon Platinum 8280 avec 768 Go de mémoire totale (24 x 32 Go, 2 933 GHz), SSD Intel de 800 Go, ucode 0x4002f00, technologie Intel HT activée, technologie Intel Turbo Boost activée, avec Ubuntu 20.04 LTS, Linux 5.4.0-26,28,29-generic, ResNet-50 v1.5. Débit :
https://github.com/Intel-tensorflow/tensorflow -b bf16/base, commit#828738642760358b388d8f615ded0c213f10c99a, Model Zoo :
https://github.com/intelai/models -b v1.6.1, ImageNet dataset, oneDNN 1.4, FP32, BS=512, testée par Intel le 18/05/2020.
2Des performances d'inférence de l'IA jusqu'à 1,87 fois supérieures avec des processeurs Intel Xeon Scalable de 3ᵉ génération prenant en charge Intel DL Boost avec BF16 par rapport à des processeurs de génération précédente utilisant FP32 sur le débit ResNet-50 pour la classification d'images.
Nouvelle configuration : 1 nœud, 4 processeurs Intel Xeon Platinum 8380H de 3ᵉ génération (préproduction, 28 cœurs, 250 W) avec 384 Go de mémoire totale (24 x 16 Go, 3 200 GHz), SSD Intel de 800 Go, ucode 0x70001b, technologie Intel HT activée, technologie Intel Turbo Boost activée avec Ubuntu 20.04 LTS, Linux 5.4.0-26,28,29-generic, ResNet-50 v1.5. Débit :
https://github.com/Intel-tensorflow/tensorflow -b bf16/base, commit#828738642760358b388e8r615ded0c213f10c99a, Model Zoo :
https://github.com/IntelAI/models -b v1.6.1, ImageNet dataset, oneDNN 1.4, BF16, BS=56, 5 instances, 28 cœurs/instance, testée par Intel le 18/05/2020.
Référence : 1 nœud, 4 processeurs Intel Xeon Platinum 8280 avec 768 Go de mémoire totale (24 x 32 Go, 2 933 GHz), SSD Intel de 800 Go, ucode 0x4002f00, technologie Intel HT activée, technologie Intel Turbo Boost activée, avec Ubuntu 20.04 LTS, Linux 5.4.0-26,28,29-generic, ResNet-50 v1.5. Débit :
https://github.com/Intel-tensorflow/tensorflow -b bf16/base, commit#828738642760358b388d8f615ded0c213f10c99a, Model Zoo :
https://github.com/IntelAI/models -b v1.6.1, ImageNet dataset, oneDNN 1.5, FP32, BS=56, 4 instances, 28 cœurs/instance, testée par Intel le 18/05/2020.
3Des performances de formation de l'IA jusqu'à 1,7 fois supérieures avec un processeur Intel Xeon Scalable de 3ᵉ génération prenant en charge Intel DL Boost avec BF16 par rapport à un processeur de génération précédente sur un débit BERT pour le traitement du langage naturel.
Nouvelle configuration : 1 nœud, 4 processeurs Intel Xeon Platinum 8380H de 3ᵉ génération (préproduction, 28 cœurs, 250 W) avec 384 Go de mémoire totale (24 x 16 Go, 3 200 GHz), SSD Intel de 800 Go, ucode 0x70001b, technologie Intel HT activée, technologie Intel Turbo Boost activée avec Ubuntu 20.04 LTS, Linux 5.4.0-26,28,29-generic, BERT-Large (QA). Débit :
https://github.com/Intel-tensorflow/tensorflow -b bf16/base, commit#828738642760358b388e8r615ded0c213f10c99a, Model Zoo :
https://github.com/IntelAI/models -b v1.6.1, Squad 1.1 dataset, oneDNN 1.4, BF16, BS=12, testée par Intel le 18/05/2020.
Référence : 1 nœud, 4 processeurs Intel Xeon Platinum 8280 avec 768 Go de mémoire totale (24 x 32 Go, 2 933 GHz), SSD Intel de 800 Go, ucode 0x4002f00, technologie Intel HT activée, technologie Intel Turbo Boost activée, avec Ubuntu 20.04 LTS, Linux 5.4.0-26,28,29-generic, ResNet-50 v1.5. Débit :
https://github.com/Intel-tensorflow/tensorflow -b bf16/base, commit#828738642760358b388d8f615ded0c213f10c99a, Model Zoo :
https://github.com/IntelAI/models -b v1.6.1, Squad 1.1 dataset, oneDNN 1.5,FP32, BS=12, testée par Intel le 18/05/2020.
4Jusqu'à 1,9 fois supérieures avec un processeur Intel Xeon Scalable de 3ᵉ génération prenant en charge Intel DL Boost avec BF16 par rapport à un processeur de génération précédente avec FP32 pour le débit BERT pour le traitement du langage naturel.
Nouvelle configuration : 1 nœud, 4 processeurs Intel Xeon Platinum 8380H de 3ᵉ génération (préproduction, 28 cœurs, 250 W) avec 384 Go de mémoire totale (24 x 16 Go, 3 200 GHz), SSD Intel de 800 Go, ucode 0x70001b, technologie Intel HT activée, technologie Intel Turbo Boost activée avec Ubuntu 20.04 LTS, Linux 5.4.0-26,28,29-generic, BERT-Large (QA). Débit
https://github.com/Intel-tensorflow/tensorflow -b bf16/base, commit#828738642760358b388e8r615ded0c213f10c99a, Model Zoo :
https://github.com/IntelAI/models -b v1.6.1, Squad 1.1 dataset, oneDNN 1.4, BF16, BS=32, 4 instances, 28 cœurs/instance, testée par Intel le 18/05/2020.
Référence : 1 nœud, 4 processeurs Intel Xeon Platinum 8280 avec 768 Go de mémoire totale (24 x 32 Go, 2 933 GHz), SSD Intel de 800 Go, ucode 0x4002f00, technologie Intel HT activée, technologie Intel Turbo Boost activée, avec Ubuntu 20.04 LTS, Linux 5.4.0-26,28,29-generic, BERTLarge (QA). Débit :
https://github.com/Intel-tensorflow/tensorflow -b bf16/base, commit#828738642760358b388d8f615ded0c213f10c99a, Model Zoo:
https://github.com/IntelAI/models -b v1.6.1, Squad 1.1 dataset, oneDNN 1.5, FP32, BS=32, 4 instances, 28 cœurs/instance, testée par Intel le 18/05/2020.