Améliorez jusqu'à 1,33 fois les performances du système Wide & Deep Recommender en choisissant les instances Amazon® M6i équipées de processeurs Intel® Xeon® Scalable de 3ᵉ génération

Wide and Deep Recommender :

  • Traitez jusqu'à 1,33 fois plus d'images par seconde sur des instances m6i.24xlarge de 96 vCPU équipées de processeurs Intel Xeon Scalable de 3ᵉ génération.

  • Traitez jusqu'à 1,22 fois plus d'images par seconde sur des instances m6i.16xlarge de 64 vCPU équipées de processeurs Intel Xeon Scalable de 3ᵉ génération.

  • Traitez jusqu'à 1,22 fois plus d'images par seconde sur des instances m6i.4xlarge de 16 vCPU équipées de processeurs Intel Xeon Scalable de 3ᵉ génération.

author-image

Par

Sur les différentes tailles d'instances, les instances M6i ont effectué plus d'opérations d'inférence que les instances M5n équipées de processeurs Intel Xeon Scalable de 2ᵉ génération

Une des applications de l'inférence du deep learning est de faire des recommandations aux acheteurs qui visitent votre site Web. Pendant qu'ils naviguent, vous collectez des données sur les produits qui les intéressent. Vous pouvez utiliser ces données, ainsi que les modèles d'autres visiteurs, pour déduire quels autres produits pourraient leur plaire et les recommander. Vous pouvez utiliser des charges de travail de deep learning, notamment les moteurs de type Wide & Deep recommendation, pour effectuer cette analyse de données en temps réel et stimuler les ventes de votre entreprise.

Nous avons comparé les performances de l'inférence Wide & Deep de deux types d'instances cloud EC2 d'Amazon Web Services (AWS) avec différentes configurations de processeurs : les instances M6i équipées de processeurs Intel® Xeon® Scalable de 3ᵉ génération et les instances M5n équipées de processeurs Intel Xeon Scalable de 2ᵉ génération. Nous avons constaté que les instances M6i de petite, moyenne et grande taille équipées de processeurs Intel Xeon Scalable de 3ᵉ génération étaient plus performantes que leurs homologues M5n. Les entreprises qui souhaitent fournir des recommandations plus rapides avec des charges de travail d'inférence Wide & Deep peuvent donc le faire en optant pour des instances M6i.

Grandes instances M6i avec 96 vCPU

Nous avons utilisé le framework TensorFlow pour tester les performances du moteur de Wide & Deep recommendation des deux séries d'instances AWS. La figure 1 montre que les instances m6i.24xlarge de 96 vCPU activées par les processeurs Intel Xeon Scalable de 3ᵉ génération ont traité 1,33 fois plus d'images par seconde (FPS) sur le banc d'essai Wide & Deep que les instances m5n.24xlarge avec les processeurs Intel Xeon Scalable de 2ᵉ génération.

Figure 1. Nombre d'images par seconde obtenues par un cluster d'instances m6i.24xlarge avec des processeurs Intel Xeon Scalable de 3ᵉ génération et par un cluster m5n.24xlarge avec des processeurs Intel Xeon Scalable de 2ᵉ génération. Les tests ont utilisé une précision int8 et une taille de lot de 512. Le plus haut est le mieux.

Instances M6i de taille moyenne avec 64 vCPU

La figure 2 montre que les instances m6i.16xlarge de 64 vCPU activées par des processeurs Intel® Xeon® Scalable de 3ᵉ génération ont traité 1,22 fois plus de FPS que les instances m5n.16xlarge avec des processeurs Intel Xeon Scalable de 2ᵉ génération.

Figure 2. Nombre d'images par seconde obtenues par un cluster d'instances m6i.16xlarge avec des processeurs Intel Xeon Scalable de 3ᵉ génération et par un cluster m5n.16xlarge avec des processeurs Intel Xeon Scalable de 2ᵉ génération. Les tests ont utilisé une précision int8 et une taille de lot de 512. Le plus haut est le mieux.

Petites instances M6i avec 16 vCPU

La figure 3 montre que les instances m6i.4xlarge de 16 vCPU activées par des processeurs Intel® Xeon® Scalable de 3ᵉ génération ont traité 1,22 fois plus de FPS que les instances m5n.4xlarge avec des processeurs Intel Xeon Scalable de 2ᵉ génération.

Figure 3. Nombre d'images par seconde obtenues par un cluster d'instances m5n.4xlarge avec des processeurs Intel Xeon Scalable de 3ᵉ génération et par un cluster m6i.4xlarge avec des processeurs Intel Xeon Scalable de 2ᵉ génération. Les tests ont utilisé une précision int8 et une taille de lot de 512. Le plus haut est le mieux.

Conclusion

Nous avons testé les performances du moteur de Wide & Deep recommendation sur deux séries d'instances AWS : les instances M6i équipées de processeurs Intel Xeon Scalable de 3ᵉ génération et les instances M5n équipées de processeurs Intel Xeon Scalable de 2ᵉ génération. Les instances du M6i ont traité jusqu'à 1,33 fois plus d'images par seconde pour trois tailles différentes. Pour stimuler vos ventes, exécutez vos charges de travail Wide & Deep recommendation sur des instances Amazon M6i équipées de processeurs Intel Xeon Scalable de 3ᵉ génération.

Plus d'infos

Pour commencer à exécuter vos charges de travail de Wide & Deep recommendation sur des instances Amazon M6i équipées de processeurs Intel Xeon Scalable de 3ᵉ génération, visitez https://aws.amazon.com/ec2/instance-types/m6i/.

Pour connaître tous les détails du test et les résultats qui montrent comment ces instances équipées de processeurs Intel Xeon Scalable de 3ᵉ génération se sont comportées par rapport aux instances équipées de processeurs Intel Xeon Scalable de 2ᵉ génération, lisez le rapport sur https://facts.pt/ZlqeNXb.