Réduisez jusqu'à 65 % le temps nécessaire à l'exécution des requêtes Databricks et économisez jusqu'à 35 % en activant le moteur de requêtes Photon de Databricks sur les nouvelles VM Edsv4 de Microsoft Azure dotées de processeurs scalables Intel® Xeon® de 2e génération

Databricks:

  • Jusqu'à 80 % de réduction du temps d'exécution des requêtes d'aide à la décision avec les VM E8ds_v4 utilisant Photon par rapport à celles sans Photon.

  • Jusqu'à 35 % de réduction du coût d'exécution des requêtes d'aide à la décision avec les VM E8ds_v4 utilisant Photon par rapport à celles sans Photon.

author-image

Par

Permettez à Photon de tirer le meilleur parti des derniers processeurs Intel pour les charges de travail d'analyse de données et d'intelligence artificielle.

Alors que les entreprises sont confrontées à des quantités croissantes de données, il devient de plus en plus important de trouver des moyens efficaces de stocker et d'analyser ces données. Les lacs de données et les entrepôts de données offrent respectivement une infrastructure de stockage à grande échelle pour les données non structurées et les données structurées. Databricks combine les caractéristiques de ces deux systèmes pour stocker et analyser de grandes quantités de données structurées et non structurées avec sa plateforme Lakehouse. Photon Engine, inclus dans la plate-forme Lakehouse, est un moteur de requête vectorisé qui peut accélérer les performances des requêtes SQL, ce qui permet de fournir des informations commerciales encore plus rapidement et de réduire les coûts.

Le benchmark d'aide à la décision dérivé de TPC-DS mesure les performances de l'entreposage de données en exécutant un nombre déterminé de requêtes et en enregistrant le temps de réalisation. Des requêtes plus rapides se traduisent par une réduction du temps de fonctionnement de la VM à payer. Par exemple, un cluster de VM Microsoft Azure E8ds_v4 avec Photon, doté de processeurs Intel Xeon Scalable de 2e génération, a fini d'interroger un cluster Databricks de 1 To en 65 % moins de temps et à 35 % moins cher que le même cluster dont Photon était désactivé. Photon fonctionne également sur des ensembles de données plus importants ; le même cluster E8ds_v4 équipé de Photon a fini d'interroger un cluster Databricks de 10 To en 62 % moins de temps et 30 % moins cher que sans Photon.

Améliorer les performances de l'entrepôt de données en utilisant Photon

Plus les requêtes d'analyse de données sont rapides, plus vous pouvez implémenter rapidement les insights pour améliorer et développer votre entreprise. Pour démontrer à quel point Photon peut améliorer les performances des requêtes, nous avons testé notre cluster Edsv4 de huit processeurs avec Photon désactivé et activé. La figure 1 montre comment le cluster E8ds_v4 avec Photon activé a complété un jeu de données de 1 To en 65 % moins de temps que le même cluster sans Photon, et a complété un jeu de données de 10 To en 68 % moins de temps.

Figure 1. Le temps de traitement relatif pour compléter les 99 requêtes d'aide à la décision du banc d'essai avec Photon par rapport à sans Photon sur des clusters E8ds_v4 pour des ensembles de données de 1 To et 10 To.

Obtenez une meilleure valeur avec Photon

Non seulement l'utilisation de Photon permet d'accélérer le temps d'acquisition des connaissances, mais cette rapidité se traduit par une réduction du temps de disponibilité de la VM, pour lequel vous devez payer. Comme le montre la figure 2, le cluster E8ds_v4 avec Photon activé coûterait 35 % de moins pour exécuter un ensemble de données de 1 To que le même cluster sans Photon, et 30 % de moins pour exécuter un ensemble de données de 10 To. Comme vous pouvez le constater, des temps de fonctionnement plus courts se traduisent par des économies.

Figure 2. Résultats des tests HammerDB normalisés comparant les performances (en nouvelles commandes par minute) des VM Esv4 avec celles des VM Esv3 avec 16 vCPU.

Conclusion

Lorsque vous souhaitez obtenir les meilleures performances d'aide à la décision de vos VM E8ds_v4, utilisez le moteur de requête Photon de Databricks pour réduire le temps d'exécution des requêtes. Ces machines virtuelles à huit unités centrales dotées de processeurs Intel Xeon Scalable de 2e génération ont exécuté une tâche TPC-DS sur un cluster Databricks en 65 % moins de temps grâce à Photon, ce qui a permis de réduire les coûts de 35 %. Lorsqu'il s'agit d'analyse de données, faites le bon choix et optez pour les VM E8ds_v4 dotées de processeurs Intel® Xeon® Scalable de 2e génération avec la fonction Photon.

Plus d'infos

Pour commencer à faire fonctionner vos clusters Databricks avec Photon activé sur des VM Microsoft Azure Edsv4 avec des processeurs Intel Xeon Scalable de 2e génération, visitez https://docs.microsoft.com/fr-fr/azure/virtual-machines/edv4-edsv4-series.

Pour en savoir plus sur les résultats discutés ici et voir comment les VM Microsoft Azure Edsv4 se sont comportées par rapport à des VM AMD similaires, lisez le rapport sur https://www.intel.fr/content/www/fr/fr/partner/workload/microsoft/enhance-databricks-azure-vms-benchmark.html.