Analysez 1,51 fois plus de données par seconde pour les charges de travail Apache Spark™ avec les instances de VM Google Cloud™ N2

Apache Spark

  • Analysez davantage de données par seconde grâce à un débit 1,51 fois plus élevé.

  • Optimisez l'analytique des données et le machine learning dans le Cloud.

  • Accélérez les charges de travail avec la mémoire persistante Intel Optane.

BUILT IN - ARTICLE INTRO SECOND COMPONENT

Obtenez des renseignements plus rapidement grâce aux instances de VM Google Cloud N2 équipées de processeurs Intel® Xeon® Scalable de 2ᵉ génération

Les charges de travail d'analytique des données, de machine learning et d'intelligence artificielle trient et donnent du sens à des quantités massives de données d'entreprise. Ces charges de travail nécessitant du calcul intensif, il est nécessaire, pour les héberger dans le Cloud, de disposer d'un matériel capable de relever les défis uniques inhérents à l'exploitation rapide des données. Si votre entreprise utilise des clusters Apache Spark (qui fournit une plateforme d'analytique unifiée pour le traitement des Big Data), le type d'instance de VM que vous choisissez a une incidence directe sur la vitesse à laquelle vous pouvez transformer les données en actions. Les instances de VM Google Cloud N2, qui sont équipées de processeurs Intel Xeon Scalable de 2ᵉ génération, peuvent optimiser les charges de travail de machine learning pour l'analyse des données des charges de travail exigeantes d'Apache Spark, afin que votre entreprise puisse lancer rapidement de nouvelles initiatives.

Lors d'une comparaison des performances du machine learning par k-means, les instances de VM Google Cloud N2 les plus récentes, qui sont équipées de processeurs Intel Xeon Scalable de 2ᵉ génération, ont surpassé les instances de VM N1 plus anciennes, qui sont équipées de processeurs Intel Xeon E5 v4. Elles ont analysé jusqu'à 1,51 fois plus de données par seconde pour les charges de travail avancées d'analytique de données Apache Spark.

Analysez davantage de données par seconde grâce à un débit 1,51 fois plus élevé.

Les instances Cloud prennent de plus en plus en charge les charges de travail à forte intensité de calcul, notamment l'analytique de données, le machine learning et l'intelligence artificielle (IA). C'est une chance pour les entreprises qui souhaitent bénéficier de l'agilité et de la flexibilité que le Cloud computing apporte au reste de leur entreprise.

Les tests comparant les performances par k-means à l'aide de la suite de banc d'essai HiBench montrent que les instances de VM Google Cloud N2 équipées de processeurs Intel Xeon Scalable de 2ᵉ génération peuvent augmenter les charges de travail de machine learning d'Apache Spark en traitant jusqu'à 1,51 fois plus de données par seconde que les instances de VM N1.

Cela signifie qu'en choisissant des instances de VM Google Cloud N2 plutôt que des instances de VM N1, vous pouvez améliorer considérablement la vitesse à laquelle votre entreprise peut traiter des données.

Figure 1. Comparaison du débit relatif des instances bhn de VM Google Cloud N1 et N2 (32 vCPU/128 Go RAM) pour les charges de travail de k-means de la suite de banc d'essai HiBench.

Les nouvelles technologies des processeurs Intel Xeon Scalable de 2ᵉ génération optimisent l'analytique de données

En choisissant des instances de VM Google Cloud N2, vous accédez aux technologies clés intégrées dans les processeurs Intel® Xeon® Scalable de 2ᵉ génération qui optimisent les charges de travail d'analytique de données avancées et de machine learning à forte intensité de calcul. Intel Advanced Vector Extensions 512 (Intel AVX-512) traite davantage de données avec une seule instruction, ce qui permet de traiter les tâches de calcul plus rapidement et d'accélérer ces charges de travail avancées. Les instances de VM Google Cloud N2 équipées de processeurs Intel Xeon Scalable de 2ᵉ génération proposent Intel Deep Learning Boost (Intel DL Boost). Celui-ci optimise les boucles de réseau neuronaux pour améliorer les opérations d'IA jusqu'à 3,4 fois. Cela en fait un outil formidable pour optimiser les charges de travail d'analytique de données et de machine learning avancées. Pour plus de flexibilité, les instances de VM Google Cloud N2 équipées de processeurs Intel Xeon Scalable de 2ᵉ génération utilisent également des FGPAs (field-programmable gate arrays) Intel. Ceux-ci peuvent être reconfigurés pour différents modèles de ML dont les algorithmes changent fréquemment afin d'accélérer les opérations d'IA.

Accélérez les charges de travail avec la mémoire persistante Intel Optane.

Les instances de VM Google Cloud N2 équipées de processeurs Intel Xeon Scalable de 2ᵉ génération offrent également la possibilité d'accélérer davantage les charges de travail d'analytique de données grâce à la mémoire persistante Intel Optane (PMem). Intel Optane PMem est une technologie combinant mémoire et stockage qui permet aux instances de VM Google Cloud N2 de placer davantage de données plus près du processeur, afin d'offrir des latences plus faibles pour l'analytique de données et le machine learning.

En savoir plus

Pour commencer vos charges de travail de machine learning d'Apache Spark sur les instances de VM Google Cloud équipées de processeurs Intel Xeon Scalable de 2ᵉ génération, consultez http://intel.fr/GoogleCloud.